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(57) La presente invention concerne un precede de 
surveillance d'une pluralite de types d'objets sur une 

pluralite de noeuds (Nl, N2 Nn) comprenant un 

noeud d'adminislration (MN) dans un syst6me infornna- 
tique. Ce precede est remarquable en ce que, la sur- 
veillance est configuree puis diffusee de maniere fillree 
a partir du noeud d'adminislration (MN) vers des agents 
aulonomes (SAA), un agent autonome etant inslalle sur 
chaque noeud a surveiller pour, en otfrant une correla- 
tion inlerlype. soil trailer au plus pres les differents types 
d*objets ou ensemble d'objels d'un demaine appele ob- 
jet global defini de maniere generique, soil remonlerdes 
informations a visualiser vers rinlerface graphique du 
noeud d'adminislration, chaque agent comporlant une 

plurality de modules specifiques (SMI. SM2 SMn) 

propres aux differents types d'objets ou d un demaine 
particulier, chaque module specilique mesuranl des p^- 
ramelres statiques el dynamiques, particuliers au type 
d'objet qu'il surveille el cellectant lesdites mesures, les- 
lanl des condilions sur lesdils paramelres relalivemenl 
a des seuils predefinis et declenchant eventuellemenl 
des actions associ^es auxdites conditions lest^es, les 
paramelres, les condilions et les actions etant modifia- 
bles par I'utilisaleur du noeud d'adminislration. 
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Description 

La presente invention conceme un precede de surveillance d'une pluralite de types d'objels d'une pluralite de 
noeuds k partir d'un noeud d'administratlon dans un systeme informatique. 

s De maniere gen6rale, un environnement de gestion distribute permet d'integrer la gestion des systemes. des 

reseaux et des applications utilisateur. Les applications de gestion sont congues de maniere ^ avanlageusement dis- 
simuler k I'utilisateur les 6tapes detaillees n6cessaires pour effectuer des travaux de gestion et garantir I'integrite des 
informations de gestion. Ces applications gerent des objets en utilisant des interfaces claires et concises avec les 
services communs de gestion. Les services communs de gestion permettent de simplifier le developpement des ap- 

10 plications de gestion. Des services "bases d'informations de gestion", appeles couramment par rhomme du metier 
MIB (Management Information Base), permettent aux applications de gestion de manipuler lesdites informations de 
gestion, ces services uttlisent, de preference, les normes applicables comme les normes OSI CfVllS/CMIP (Open Sys- 
tems Interconnection Common Management Information Services/Common Management Information Protocol) et In- 
ternet SNMP (Simple Network Management Protocol). Un obj^t gere est, dans cet environnement informatique, une 

IS representation de ressources telles qu'une machine, un fichier, un periphdrlque. un utilisateur, une application, etc.. 
Une MIB qui est en fait un ensemble d'objets, represente les differentes ressources a administrer dans un systeme, 
Un objet d'une MIB est d6fini par une classe d'objets (correspondant ^ un type d'objet) et une instance de cette classe 
d'objets. Une requele est emise par une application en vue de consutter et/ou de modifier un objet de la MIB. elle est 
caract6ris6e par le type d'op6ration ^ appliquer sur un ou plusieurs des objets de la MIB. L'exploitation efficace d'un 

20 tel environnement de gestion distribute suppose une architecture flexible qui autorise une administration aisee de 
difftrentes sortes d'objets. Plus formellement. dans un tel environnement. les systemes informatiques qui sont cons- 
truits sur des architectures reparties impliquent que les services requis par une application sont situes sur ptusieurs 
syst6mes qui communiquent entre eux, comme par exemple, les systemes de transactionnels, les systemes de gestion 
de bases dedonnees SGDB, les systtmes d'impression, les systemes de s6curite, lesannuaires, etc.. Cette repartition 

2S ou distribution ontraino uno grando souplcssc d'utilisation ot autorise des gains importants en performance (resoau 
en grappe /cluster"), cependant. le fait do multiplier les systemes k administrer pose un problemo. car cette multipli- 
cation a egalement pour effet d'augmenter de maniere significative ta probability de dysfonctionnement sur au moins 
un systeme. Une solution ^ ce probleme consiste ^ dtvelopper des systemes d'administration pilotes par un gestion- 
naire (appele aussi "manager" par I'homme du metier) qui contrfile et dirige tout un systeme par I'intermediaire d'agents 

30 qui ont exclusivement pour objet d'une part, d'executer les requites du gestionnaire utilisant principalement des fonc- 
tions du type "get" ou "set" et d'autre part d'informer ledit gestionnaire des ev6nements relatifs au systeme surveille 
qui utilise une fonction du type "trap". L'utilisation du protocole SNMP et d'agents SNMP fournit un exemple courant 
d'une application d'une lelle organisation qui, a pour principal avantage d'etre simple, mais qui prtscnto ccpondanl 
de notables inconvenients donl le premier est de generer un Important trafic sur la ligne entre le gestionnaire et les 

35 agents pour ta transmission des requetes. des reponses ^ ces requetes ainsi que des tvenements. Un autre important 
inconvenient est relatif a la lenteur du temps de reaction tors de ['apparition d'un evenement, ceci etant du au fait que 
I'agent concerne doit d'abord avertir le gestionnaire de cet evenement qui ensuite doit prendre une decision manuelle 
ou automatique relativement a cet evenement pour la transmettre audit agent qui a son tour I'execute et enfin en rend 
compte au gestionnaire. 

40 La presente invention a pour but de remedier a ces inconvenients de I'art anterieur et propose un procede qui, 

entre autres. permet de rtduire de maniere tres significative le trafic sur la ligne et le temps de reaction lors de I'ap- 
parition d'evenements, procede qui permet de surveiller efficacement le fonctionnement d'une ou plusieurs applications 
sur une pluralite de noeuds. 

Pour cela le procede de surveillance mentionne dans le prtambule est remarquable en ce que la sun/etllance est 
45 configurte puis diffusee de maniere fittrte ^ partir du noeud d'administration vers des agents autonorr.es. un agent 
autonome etant install^ sur chaque noeud ^ surveiller pour, en oftrant une correlation intertype, soit traiter au plus pres 
les difftrents types cl'objets ou ensemble d'objels d'un domaine appel6 objet global dtfini de manitre g6n6rique, soit 
remonler des informations a visualiser vers I'inlerface graphique du noeud d'administration, chaque agenl comportanl 
une plurality de modules sptcifiques propres aux differents types d'objets ou ^ un domaine particulier. chaque module 
so specifique mesurant des parametres stattques et dynamiques, particuliers au type d'objet qu'il surveilte et collectant 
lesdites mesures, testant des conditions sur lesdits parametres relativement ^ des seuils predefinis et declenchant 
6ventueltement des actions assocites auxdites coriditions testees, les parametres, les conditions et les actions etant 
modifiables par I'utilisateur du noeud d'administration. 

Ainsi, selon I'idee de I'invention et ceci centre toule attente. Tutilisatton d'agents autonomes permet de s'assurer 
55 du bon fonctionnement des applications surveillees sur I'ensemble des noeuds k I'aide d'un t/aitement autonome et 
efficace, de faire remonter trds rapidement des noeuds vers le noeud d'administration les informations utiles et de 
lancer de maniere automatique des actions sur certaines conditions ou de conseiller tventuellement une action. De 
cette manifere. pour assurer une surveillance efficace des applications fonctionnant sur la plurality de noeuds, le pro- 
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cede ici applique va permettre de mesurer des param^tres sp6cifiques de chaque application, de tester des conditions 
surcos parnm^lres relalivemenl a des seuils puis d'exdculer une action pourprevenird'un probl^me, pour reconfigurer 
ou corriger. Pour cela, des mesures sont collectees pour r6aliser une analyse en temps diff6re dans le but d'un examen 
slatislique de l*activite surveillee. Ces mesures collectees concernent lous les types d'objets ^ survelller. par exemple 
ici des instances telles que des bases de donn6es comme Oracle (marque d'Oracle Corporation), Infornnlx (marque 
de Informix Software, Inc.). les applications comme Tuxedo (marque de Novell, Inc.), differentes machines ou uno 
quelconque machine d'un systeme, Timpression distribuee ("DPF" Distributed Print Facility : marque de Xerox Corpo- 
ration), etc.. Des correlations peuvent etre realisees entre plusieurs mesures differentes, en particulier, entre divers 
types d'objets : correlation intertype. 

L'utilisateur principal du proced§ est I'adminislrateur de I'application ou roperateur Sauf exception, Toperateur ne 
peut agir directemenl autrement que pour consulter I'afflchage pre-configure. De preference, pendant la surveillance, 
sont affiches I'etat des applications ainsi que les courbes de parametres choisies pour leur importance par I'adminis- 
iraleur, ceci afin de permettre de verifier le bon fonctionnemenl de ou des objets sous surveillance. En outre, si I'ope- 
rateur ou I'administrateur desire, de maniere ponctuelle mais interactive, visualiser certaines informations plus de- 
tainees, un certain nombre de possibiiites lui sont offertes comme I'affichage d'autres courbes de mesure ou le "zoom" 
sur des mesures ou des parties de courbes. Si, de maniere generale, I'objet ^ surveiller est relatif a un objet unique 
(de base) taisant parlie d'un environnement de production, ledil objet peut egalement atre un objet global (ou une 
application globale), c'est-a-dire un ensemble d'objets de base contenant, par exemple, une ou plusieurs bases de 
donn6es ainsi qu'une application du type Tuxedo et 6ventuellement d'autres objets de base. Ces objeis globaux peu- 
vent elre soil, prealablemenl connus el done Iraites de maniere specifique, soil non connus et. dans ce cas. Irailes 
comme une entite opaque mais contenant des objets de base connus. Dans chaque agent, installe au plus prds des 
objeis a trailer, une pluralite de modules speclfiques sont Integres, chaque module etant specifique d'un type d'objet, 
Oracle, Informix, Tuxedo, systeme Unix, impression distribuee (DPF), etc.. Chaque module specifique mesure des 
parametres particuliers au type d'objet qu'il surveilie, II propose, par defaut, une liste de parametres a mesurer, des 
conditions a cvaluor ot dos actions associees. L'utilisatour a toutc la latitude pour, ^ partir du noeud d'administration, 
modifier ces choix par defaut. Chaque agent autonome installe sur chaque noeud (ou machine), outre les mesures de 
parametres qu'il effectue, les conditions qu'il lvalue (sur ce noeud), les actions (reconfiguration, correction, alerte) 
associees aux conditions qu'il lance ou les trailements en temps dilfere qu'il opere, remonte au noeud d'administration 
les informations a afficher, telles que, par exemple, le changement d'etat des objets, les valeurs de parametres a 
visualiser sous forme de courbe, etc.. 

De celle maniere, grace a I'idee de Tinvention, le noeud d'administration a une excellente visibilite globale puisque 
le present procede permet. une fois la surveillance configur^e de maniere filtree (c'est-a-dire qu'une configuration est 
propre a un objel et son environnement et qu'ainsi un meme objel peut etre configure ditferemment salon sa situation 
el sa distribution), de surveiller une pluralite de types d'objets. d'en donner des fonctions unifiees et egalement de 
permettre de correler entre elles des mesures sur des objets de type different. La correlation porte sur I'affichage de 
courbes. de conditions, d'actions associees ainsi que sur I'analyse en temps differe. II est en outre ^ remarquer que 
ce procede doit etre portable sur differentes plate-fornnes, ceci impltque sa totale independance relativement a son 
environnement d'execution, la visualisation se faisant au moyen d'une interface graphique propre audit procede. Ce 
procede est prevu pour autoriser tout interfa9age avec un quelconque systeme d'administration pour off rir a I'utilisateur 
une administration integree. Les agents autonomes accident aux differentes informations & travers les protocoles 
standards existants. 

Avantageusement, pour I'application du procede de surveillance selon I'lnvention, le noeud d'administration com- 
porle entre autres, une interface graphique uliltsaleur pour la visualisation des objets seleclionnes et I'affichage de 
courbes de valeurs de parametres, un tichier de configuration qui conlient I'ensemble des conliguralions des objeis 
avec la description desdits objets de meme que I'ensemble des parametres pr6d6finis statiques ou dynamiques, ce 
fichier eiani analyse et dynamiquement modifie ou complete, des fichiers d'etat des noeuds a surveiller ainsi que les 
fichiers d'affichage des parametres, les parametres mesures 6lant stockes dans un fichier d'analyse pour permettre 
leur alfichage par Tintermediaire de I'interface graphique. 

De maniere remarquable, I'agenl autonome installe sur chaque noeud a surveiller se compose principalement 
d'un agent generique en relation avec une plurality de modules spectfiques chacun propre a un type d'objet ou a un 
domaine particulier. de fichiers contenant les fonctions de base utilisees, chaque noeud ^ sun/eiller possedanl de plus 
ses propres fichiers de parametres, de conditions et d'actions associees pour controler sa propre surveillance et ainsi 
aulorisor Ic traitcment au plus pros dos differents types d'objets en mosurant los parametres, en ovaluant los conditions 
et en lan^ant les actions liees aux conditions et ceci pour tous les objets decrits. 

Egalement de maniere remarquable, lorsqu'une condition non liee a un paramdtre porte sur un ou plusieurs pa- 
rametres et done sur un ou plusieurs objets, ladite condition est traitde sur le noeud d'administration par un agent 
generique qui traite les conditions sur plusieurs noeuds, cet agent generique "d'administration" langant Taction sur le 
noeud d'administration. 
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La description survante en regard du dessin annexe, le tout donne a titre d'exemple non linnitatif . fera bien com- 
prendre comment Tinvention peut etre realisee. 

Sur la figure unique est represents de maniere tres schematique un exemple d'application du precede conforme 
k ('invention pour rintercommunicatton entre un noeud d'administration et un noeud ^ surveiller 

Comme cela a ete vu precedemment. le proc6d6 selon I'invention permet de surveiller avantageusement n ma- 
chines, c'est-^-dire n noeuds. Ni. N2 Nn, k partir d'un noeud d'administration MN. Principalement pour I'intercommu- 
nication qui interesse I'invention, le noeud d'administration MN comporte un certain nombre de composants parmi 
lesquels I'interface graphique utilisateur GUI et le fichier de configuration CF Uinterface GUI permet de montrer dans 
la fenetre principale sur I'ecran les objets selectionnes dans la liste des objets pouvant etre vtsualis6s, un icone pour 
chaque objet avec une couleur, par exemple. vert, orange et rouge, selon son etat. Egalement, lorsqu'un objet est 
s6lectionn6 et qu'un "zoom" est demande par I'interm6diaire de la barre de menus, une fenetre de nom de I'objet est 
affich6e contenant tous les objets composant ledit objet. Uinterface GUI permet aussi I'affichage de courbes de valeurs 
de parametres avec. si cela est desire, plusieurs courbes dans le meme graphe. A chaque objet decrit, lors de la 
configuration de la surveillance, peut etre adjointe une liste de.graphes. tandis qu'a chaque graphe est associee une 
liste de paramfetres a visualiser. Uinterface GUI permet d'appeler au moins un outil d'administration pour chaque type 
d'objet alors qu'en outre. I'expertise ou I'experience memorisee d'un utilisateur ou d'un outil d'un utilisateur. qui est 
d*une aide precieuse pour la surveillance, peut etre avantageusement affichee. Le fichier de configuration CF contienl 
I'ensemble des configurations des objets avec la description desdits objets de meme que rensemble des parametres 
pr6d6finis siatiques ou dynamiques, il peut 6lre analys6 et dynamiquennent modified ou compl6t6. Par t6l6chargement 
du lichier de configuration, par exemple. les agenls aulonomes sonl inslalles. via I'jnlerlace IWMN (du noeud NI ) avec 
!e noeud d'administration MN sur les noeuds ^ surveiller ^ partir du noeud d'adminislralion MN, une commande spe- 
cifique etant utilisee pour installer I'agent autonome SAA, comme ici sur la figure, sur Ic noeud NI. Chaque noeud a 
surveiller possede alors ses propres fichiers SL ("scanlog") de parametres, de condHions cl d'actions associees qui 
lui permettent de controler sa propre surveillance, le noeud d'administration detenant do plus les fichiers d'etat des 
noeuds ^ survGillor ainsi quo los fichiers d'affichage des param6trGs (ensemble do lichicrc "trace" TF). La misc a jour 
de la liste des noeuds ou un agent autonome est install^ est faite automatiquement par lo nooud d'administration. Le 
lancement et I'arret du precede de surveillance sont contr6l6s par le noeud d'administration De maniere aisee. un 
objet nouveau peut se voir appliquer le procede selon I'invention el etre surveille par un agent autonome deja configure. 
Un agent autonome SAA est principalement constitue d'un agent g6nerique GA en relation avec des modules speci- 
fiques SM (SM1. SM2. ... SMn) chacun propre ^ untype d'objet ou ^ un domaine particulier. ainsi quede fichiers parmi 
lesquels Tun est destine k contenir les fonctions de base BF utilis6es. 

Le traitement des conditions peut concerner plusieurs objets. la question est alors de savoir sur quel noeud sont 
traitees les conditions. En effet, une condition peut etre liee a un parametre d'un objet. ette fait alors partie de la 
description de ce parametre. Un parametre contient la description de sa mesure (commando a lancer, analyse, affi- 
chage de courbe....). la description d'un certain nombre de conditions simples portant sur la mesure qui vient d'etre 
faite (op6rateur, seuil. ...) avec pour chaque condition, faction k lancer lorsque ladite condition est verifiee. Un para- 
metre est attache k un objet qui lui. est toujours associd a un noeud, le traitement du parametre et de ses conditions 
se fait done sur le noeud associe k I'objet. Par centre, une condition peut ne pas etre liee a un parametre. elle porte 
alors sur un ou plusieurs parametres et done sur un ou plusieurs objets. Dans ce cas. la condition est traitee sur le 
noeud d'administration ou se trouve egalement un agent g6nerique GA' legerement different de I'agent generique GA 
contenu dans un noeud ^ sun/eiller en ce qu'tl traite les conditions sur plusieurs noeuds, cet agent GA' langant Taction 
sur le noeud d'administration. En outre, une action, predefinie ou externa peut demander la valeur d'un parametre d'un 
objet surveill6 par un autre noeud que le noeud ou est executSe Taction. Dans ce cas, une des fonctions de base BF 
qui demande la valeur va transferer cette demande au noeud d'administration qui la dirigera alors sur le noeud adequat 
et la valeur sera retoumee en sens inverse. 

Chaque module spScifique, SMI. SM2,..., SMn. documente sa partie predefinie en proposant des listes de choix 
par d6faut de parametres k mesurer (par exemple, identifiant de paramfetre, description de la mesure. p6riode. stockag6 
ou pas des valeurs dans un fichier "trace" TF. affichage ou pas des valeurs), de conditions a evaluer sur ses parametres 
et d'actions associ6es k lancer. Un parametre peut etre egalement une information sur T^tat d'un objet (fonctionne 
bien, ce qui dans Texemple precedent correspond k un icone de couleur verte. mise en garde ou alerte correspondant 
a un icone de couleur orange, alarme ou panne correspondant a un icone de couleur rouge) ou une mesure comme 
par exemple "le nombre de transactions par seconde". Si une condition de parametre est v6rifiee, une action est lancee 
et il est not6 le fait qu'une action est lancde dans un fichier de journalisation d'actions (action, niveau, date, identifiant 
de parametre, identifiant d'objet. noeud,...). 

Pendant la configuration de la surveillance, Tutilisateur du noeud d'administration d6crit.les objets a surveiller 
[syst6mes (Unix, ,..), applications (Tuxedo, ...), instances (Oracle, ...), serveur (Informix,...). ...] et specifie des modifi- 
cations par rapport aux choix par d6faut des modules specifiques (modification de la p6riode de mesure d'un parametre 
par exemple, suppression d'un parametre, ajout d'un parametre ou d'une condition). Pour chaque nouveau parametre 
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a mesurer. il decrit la commande do mesure. precise s'll est desir6 afficher la mesure (sous forme de courbe). specifie 
les conditions qui vont declencher une action (une sequence de trailements). L'action peut consister a afficher l'6tat 
"en panne" d'un objel (instance Oracle par exemple) en utilisanl une fonclion fournie par le produit ou bien effecluer 
un test de correlation avec une information systeme (taux d'occupation cpu par exemple) ou de type Tuxedo ou encore 
definie par I'utilisateur. 

Une fois la surveillance configuree. cette derniere peul etre lancee. La configuration ne peut pas etre modifiee 
pendant une surveillance, il est pour cela tout d'abord necessaire d'arreler la surveillance pour modifier la configuration 
puis de relancer la surveillance sur tous les agents. 

Lorsque la sun/eillance est lancee sur chaque noeud ^ surveiller, le principe de base est que le "surveillant" sur 
chaque noeud ne dialogue pas avec le noeud d'admiinist ration sauf pour aflicher I'elat d'un objel ou la courbe d'un 
parametre ou encore prevenir Tadministrateur Les actions sont soit locales. c*est-a-dire internes au noeud. soil de- 
mandenl un service (essentieilement d'affichage) au noeud d'administration. 

Egalement. une des fonctions de base presentee avec le present precede est pr6vue pour ramener (sur le noeud 
d'administration) les fichiers SL de journalisation de parametres ainsi que ceux d'actions de chaque noeud surveille, 
pour I'analyse independante realisee par le noeud d'administration. 

De cette maniere. I'administrateur configure la surveillance en ecrivant direclement dans le tichier de configuration 
des commandes Itgnes. Cependant, selon une varianie, il est possible d'utiliser un outil graphique de configuration qui 
generera le fichier de configuration. Ci-apres est propose un exemple de syntaxe des commandes ligne pour specifier 
les objets et les parametres. 

Un # en debul de ligne indique une ligne commenlaire, ceci permel d'invalider une commande sans la supprimer 
ou de commenler le fichier. 

Suit un exemple non limitatif de specification de tichier de configuration que I'administrateur aurait la possibilite 
de realiser pour decrire des objets qu'il voudrait surveiller. pour modilier Ic trailement predefini de I'agent (et des mo- 
dules specifiques) et/ou pour creer de nouveaux parametres et conditions. 

MAX_CPU percent of total cpu ; 
signilio le tomps maximum cpu ailoue pour I'agent autonome (agent genoriquo et modules specifiques) sur un noeud. 
Si le maximum est atteint, les modules modifient la frequence de mesure des parametres et/ou donnent priorite a 
certains traitements. 
=ii PERIOD seconds ; 

specifie rintervalle minimum de temps entre deux mesures d'un parametre Cclle valeur globale peut etre ponctuelle- 
ment modifiee pour un parametre ou une condition. 

==> OBJECT objecMdent, 

[NODE = node] [BACKUP_NODE = backup_node] 
DESC = ( 

SYSTEM. UNIX_ADMIN_USER=<unix_user>. GIBUS_ROOT=<ism_root> 
! TUXEDO, { V1CONFIG=<config_path> 

!TUXCONFIG=<tuxconfig>TUXDIR=<luxdir>APPDIR=<appcJir>, 
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UBBFILE=<ubbfile>, 

LANG=<lang>,UNIX_ADMIN_USER=<unix_user>, 

LIBPATH=<libpath>, QMCONFIG=<qmconfig> 

} 

! ORACLE. { V1 CONFIG=<config _path> 

!ORACLE_SID=<sid>, ORACLE_HOME=<oracle_home>. 
UNIX_ADMIN_USER=<unix_user>. ORACLE_USER=<user>, 
ORACLE_PASSWORD=<password>, 
'5 CONNECT_STRING=<connect_string>, TNS_ADMIN=<tns_admin>. 

} 

IINFORMIX, INFORMIXSERVER=<informixserver>. INFORMIXDIR=<informixdir>. 
20 ONCONFIG=<onconfig>. UNIX_ADMIN_USER=<unix_user> 

ISYBASE. SYBASE=<sybdir>. DSQUERY=<servemame>. 

UNIX_ADMIN_USER=<unix_user>. SYBASE_USER=<user>. 

SYBASE PASSWORD=<password> 

25 ~ 

IXCP2POOL, CONFDIR=<confdir>. UNIX_ADMIN_USER=<unix_user> 
!GLOBAL,UNIX_ADMIN_USER=<unix_user>. 

COMPONENTS=((objectJdent. father_sev). ...) 

) 

[obj_display_clause] 

[SCANLOG=([LOGFILE=(!ogpathnanne,[logpathname] .„)] 
55 [ERROR_CONTROL=error_controLfile] 



definit un objet "system" (un systeme Unix pris en charge par le module specifique "System" qui mesure le taux d'oc- 
•^0 cupation du cpu. le nombre d'entrees/sorties par seconde, ...), ou un objet "application Tuxedo", ou une "instance 

oracle" ou encore un objet "global_object" compose d'une instance Oracle at d'une application Tuxedo par exemple. 

L'utilisateur choisit (par I'intermediaire de Tinterface GUI) la liste des objets k voir (leur icone) dans la fenetre 

principale de I'interface GUI. Un objet non s6lectionne dans cette liste n'est vu que si un "zoom" est realise sur un objet 

global qui le contient. Un objet global peut 6galement etre r6lerenc6 en tant que composant (COMPONENTS) d*un 
4S objet global et est composant d'un objet global [GLOBAL (une instance Oracle particuliere est choisie dans la liste des 

objets k voir dans la fenetre principale car les utilisateurs font directement du SQL sur la base)] car cette base est 

acc6d6e par une application donn6e. Quelques tenmes employes ci-avant, peuvent 6tre ainsi explicit6s : 

NODE :Pour un objel SYSTEM. NODE est le nom du nbeud.. Pour une instance Oracle, NODE est le noeud ou 

se trouve rinstance. Pour une application Tuxedo, NODE est !e "master node". Pour une application_globale. s'il n'y 
50 a aucun parametre cree pour cet objet, on ne mentionne pas de NODE et s'il y a des parametres crees pour cet objet. 

NODE doit etre mentionne et la mesure sera execulee (la condition sera evalu6e et Taction lancee) sur le noeud specific 

par NODE. 

BACKUP_NODE : est lo nom du nooud ou va tournor I'objot (lo "master node" Tuxedo. Tinstanco Oracle, ...) on 
cas de basculement de I'applicalion sur un autre noeud, pour raison d'exploitation ou d'arret, par exemple panne, du 
ss noeud d'origine. Cette information est ulilisee pour demarrer rapidement la surveillance de Tobjet sur le noeud "backup". 

ORACLE : c'est le type de I'objet qu'on d6crit. ORACLE_SID est le nom de I'instance. Quand un utilisateur se 
connecte k une base Oracle, il 6crit <oracle_user>/<oracle_password>@<connect_string>. UNIX_ADMIN_USER est 
un nom d'utilisateur Unix qui sera utilise par la surveillance, dppuis le noeud d'administration. pour executer des trai- 
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temenls sur la base Oracle silu6e sur le noeud k surveiller. 

COMPONENTS : L'identrfiant d'objet (objectjdent) de tous les objets fils est donn6 el pour chacun des tils est 
donnee la couleur (OK {vert], WARNING lorange], DOWN[rouge]) h6ril6e par le p6re si le fils prend la couleur rouge 
(DOWN). DOWN est la valeur par d6faul de "father_sevr 

5 SCANLOG : pour chaque objet I'administrateur peul designer les fichiers SL de journalisation ("log") a explorer et 

les erreurs "graves" a rechercher. Si I'oplion SCANLOG n'existe pas, rien n'est fait sur les fichiers "log". Si le fichier 
-log" LOGFILE n'est pas decrit (les fichiers a explorer ne sont pas specifies), chaque module specifique a predefini 
une regie de construction de la lisle de fichiers a explorer. Le fichier error_conlrolJile d6crit les erreurs ^ rechercher 
dans les fichiers "log" el associe a chaque erreur un identifiant (chaine de caracl6res) de classe d'action : si I'erreur 

10 est trouvee. Taction specifiee est appel6e en iui donnant la classe d'action associee qui sert a aiguiller sur le bon 
irailemenl. Par exemple. "ORA-0600': 2 ACT^RESTART" veut dire que si I'erreur -ORA-0600" est trouvee dans le 
fichier alert_<sid>.log alors une action (predefinie par le module specifique ou foumie par radminislraleur en modifiant 
par MODIF_COND_PARAM le parametre predefini ORA_PARAM_LOG) est appellee en passant comme argument la 
classe ACT_RESTART ainsi que "I'objectjd", etc. Si "ERROR.CONTROL" n'est pas d6crit, le fichier predefini par 

15 chaque module specifique est pris. Si une des erreurs mentionnees dans ie fichier "error^controljile" apparatl, une 
action predelinie ou detinie par I'ulilisateur est activee. 

SCANLOG=() veut dire prendre en compte les fichiers "log", le fichier ■error.controljile" et Taction par d§fauL 



20 ==> MODIF_PARAM paramjdent 

{ [IGNORE] 

I [TRACE ! NOTRACE] [PERIOD=seconds] [NB_VALUES=nl 
[param_display_clause] 

}; 

-param_idenf est I'identifiant du parametre. Pour les parametres pr6d6finis par les modules sp6cifiques. -paramjdent" 
30 est un mol-cle decrit : Putilisaleur peut modifier certains atlribuls de ce parametre pr6defini [periode. analyse ("trace"), 
aflichage, la condition] ou le supprimer mais il ne peut pas changer la commande. L'information k obtenir est soil un 
indicateur d'etat d'un objet (0 si "OK" [vert], 1 si 'warning' [orange], 2 si "down" [rouge], par exemple) soil une mesure 
(metrique) d'un objet. 

TRACE : la mesure est stockee dans un fichier TF "trace", pour une analyse autonome, 
35 PERIOD est la periode de collecte. 

IGNORE : I'adminislrateur ne veut pas que ce parametre soil mesure periodiquement. Pardefaut, chaque module 
specifique va mesurer regulierement un certain nombre de parametres (metrique et indicateurs de sante). Ces para- 
metres sont decrits. Chaque paramfetre qui est mesure est identifi6 de maniere unique pour un type d'objet. Exemple 
"Ora„Aclivc_Transaclions". H est permis. dans une condition ou dans une action, de demander une mesure en temps 
-^0 reel el non periodique d'un parametre qui a I'oplion IGNORE (voir la fonction de base "GelOnlineV^lue"). 

NB.VALUES : par default chaque parametre pr6defini pourra avoir un nombre maximum de vaieurs rangees dans 
une table de resultat. Ce nombre predefini est propre a chaque parametre : il depend de fonctions predefinies comme 
-getjasl_value", "gel_della". "get„average(20)". quidemandent laou les ndernieres vaieurs du parametre. Ce nombre 
predelini est done coherent avec les conditions et actions predefinies. Si radminislraleur ajoule des conditions ou 
■^5 actions exlernes qui demandent un plus grand nombre de dernieres vaieurs, il modifie le nombre par "NB.VALUES" 
(ia nouvelle valeur doit etre plus grande que la valeur predefinie. sinon il y a alene (-warning") et le nombre de vaieurs 
n'est pas moditi6). 



so 
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==> MODIF_COND_PARAM objectjdent, param_ident. 

condition_rangr_number 
{ [IGNORE! 

I [CONDITION = param_conditlon] 
[ACTION=( UNIX_FILE, "unix.file [args]' 

! UNIX_COMMAND, •unix_immediate_cmd' 

! SPECIF_FILE. •command_fiie [args]' 

! SPECIF_COMMAND. 'specific_immediate_command' 

1 

}: 

les paramelres, les conditions el les actions sonl predefinis complelennent, I'idenlifianl "paramjdenl" de chaque pa- 
ranifetre et done la condition qui va §tre traitee. ainsi que sa periods sont decrits. 

II est possible de nnodifier une condition simple predefinie associee a un parannetre et identifiee par I'identifiant 
"paramjdent* du parametre et le nunnero de la condition (1 . 2 ou 3). S'il est desire modifie la periode. il est necessaire 
de passer par "MODlF_PARAM" de I'identifiant ■param_ident". L'administrateur peut personnaliser en modifiant toute 
la condition ou lo seuil (ot son hystdrosis ou la valour do "DURING" contornncnnonl ^ la condition "param_condition'). 
ou rintervatle de valours d'une condition, ou supprimer ("IGNORE') le traitoment de cette condition, ou encore fournir 
sa propre action ^ exdcuter si la condition est verifiee. Pour "UNIX_F1LEV "UNlX_COMMAND". "SPECF_F1LE'' et 
"SPEClF_COMMAND" voir dans la suite "CREATE_PARAM". Chaque nnodule specifique documente ses parannfetres 
pr6definis et en particulier sa condition : test du resultat de la mesure par rapport a un seuil ou par rapport ^ un seuil 
pendant n secondes ou par rapport a un Intervalle ("RANGE"). 

==> MODIF_COND_MULTIPLE condjdent 
{[IGNORE] 

I [ACTION=(UNIX_FILE;unix_file [args]' 
! UNlX_COMMAND. ^unixjmmediate_cmdl) [PERIOD=seconds] 

}: 

permet de modifier une condition multiple preddfinie identifiee et documentee sous le nom "condjdent". Les seuils 
d'une condition multiple ne peuvent pas etre modifies : l'administrateur peut suppnmer la condition multiple predefinie 
et s'en creer une nouvelle ou il met les seuils qu'll desire. 
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==> CR_PARAM objectjdent. paramjdent 

MEASURE=(SPECIF_FILE. 'command_file [args]' 

! SPECIF_COMMAND, 'specificJmmediate_command* 

! UNIX_FILE;unix_file [args]' 

I UNIX_COMMAND, 'unixjmmediate_cmd' 

,[ARG_REQ] 

[STATE I METRICS! [RESULT_TYPE={INI I FLOAT}] 

[PERIOD=seconds] 

[NB__VALUES=n] IJRACE]) [param_display_clause] 
[CONDITIONI] = (param^condition 
ACT10N=(UNIX_FILE. 'unix__file [args]' 

! UNIX_COMMAND, 'unixjmmediate^cmd' 

! SPEC1F_FILE, *command_flle [args]' 

! SPECIF_COMMAND. * specific Jmmediate^command' 

) 

)] 

[CONDlTION2=(...)l 
[C0NDIT10N3=(...)] 



L'administrateur peut cr6er ses propres parametres et leur associer une commande ("MEASURE^"). 

SPECIF_FILE : si I'objet est Oracle, il est fait du SqlPlus sur te fichier sql. Autoris6 pour !es objets de type Oracle, 
Informix, Sybase. L'Gx6cution est Ianc6e pour le compte de rutilisateur "ORACLE_USER" (pour Oracle) sp6cifi6 dans 
Tobjet, 

SPECIF_COMMAND : si I'objet est Oracle, il est fait du Dynamic Sql sur cette commande sqL Autorise pour les 
objets de type Oracle, ^execution est lancee pour le comple de I'utilisateur -ORACLE^USER" specific dans Tobjet. 
Longueur maximum de la commande : 512. 

UN!X_FILE et UNIX„COMIUAND: la commande unix est lancee. Autorise pour tous les objets. L'ex6cution est 
lancee pour le compte de I'utilisateur "UNIX.ADMIN^USER" sp6cilie dans Tobjel. Dans le cas de "UNIX.FILE-, le 
fichier "unixjile" est telecharge (au d6marrage de la surveillance) sur le noeud associe ^ I'objel reference par 
■objectjdent". Pour "UNIX_COIv4MAND-. il n'y a pas de telechargemenl : la commande est transportee par le para- 
mfetre. 

Si -objecljdenl" esl un objel "GLOBAL", la commande est execulee sur le noeud specifie par "OBJECT... 
NODE=node ..." 

STATE ou IVIETRIGS : un parametre est soit un param^tre d'etat (il repr^senle le bon fonctionnement d'un objet) 
ou une m6trique (le nombre de transactions par seconde, par exemple). Si "STATE", en fin de trailement de la mesure. 
il est appel6 la fonction d'affichage de l'6lat de I'objet (icone vert/orange/rouge) si I'etat a chang6 depuis la dernifere 
mcsuro. 

RESULT_TYPE : "INT" (entier) ou "FLOAT" (pour un pourcentage par exemple). 

CONDITION : si I'ulilisaleur cr6e un parametre et qu'il precise une condition simple, il I'^crit "dans la foul6e". La 
condition est evaluee "dans la foulde" de la mesure et non ind6pendamment du moment ou la mesure est faite. 

ACTION : on specifie le nom complet d'un programme shell ou binaire suivi 6ventuellement de parametres 
("UN1X_FILE") ou une commande Unix ("UNIX.COMMAND") ou d'un fichier sql ("SPECIF.FILE") ou une commande 
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sql CSPECIF.COMMAND"). Un exemple est '*ACTION=(UNlX_FILE. alLactions_binary action_r)" : radministrateur 
fournit un seul programme pour toules les actions. Ce programme aiguille selon le premier parametre qui est le nom 
d'une action particuliere. Le procede de surveillance appelera ce programme avec tous les paramelres mis dans 
"unix_file [args]" et ajoutera des parametres qui representent le contexte comme I'identifiant "objectjdent". I'identifiant 
5 "param.idenf, la valeur du parametre (voir fonctions de base plus loin). 

ARG_REQ : mettre cette option si la mesure demande un argument qui sera fourni plus tard dans "single_condition" 
dans "GetOnlineValue". Permet de faire un controle ^ la reference dans "single_condition''. Exemple : "GetOn line Value 
(or714.0RA_TS_FREE_PERCENT. TABLE SPAC E_1 )* donne le pourcentage libre de I'espace table 
"TABLESPACE.r. 

10 => CREATE_COND (single_condition [ AND/OR singte_condition ] ...) ACTION =(UNIX_FILE . 'unixjile [args] 



pour una condition creee par I'utilisaleur. il specif ie la periode et Taction. Mises entre parentheses possibles pour la 
resolution des conditions uniques (''single_conditions"). La condition est 6valu6e par I'agent g6n6rique GA* sur le noeud 
d'administration. L'action est lancee sur le noeud d'adm in ist ration (le fichier "unix_file" se trouve done sur ce noeud). 
75 obj_display_clause : 

DISPLAY= (lGRAPH=(graphJdent TITLE="..." |TYPE =curve ! pie! histogram] lMIN=min_value. 
MAX=max_vaIue]) [GRAPH=(graphJdent.. .)]...]) 

GRAPH : radministrateur associe a un objet des graphes de parametres. "TITLE" est le libelle du graphe. 
TYPE pour courbe. camembert. histogramme, quand on afflche des parametres dans un graphe de type "courbes". 
20 it faul donner la valeur min et la valeur max pour representor Tordonn^e (sachant que I'abscisse est la dale de la 
mesure du paramfetre). Le d6faut est 0,100 comme pour un pourcentage. L'icone est en vert/orange/rouge selon son 
etat ("OK". -WARNING". "DOWN"). 

param_display_clause : DISPLAY^ ("paramjitle", [GRAPH=(graphJdent [graph_ident]...)) 
Par defaut, aucun parametre n'est affiche, "param_title'' est le libelle du parametre. GRAPH : specifier dans quels 
^5 graphes so trouve le parametre. Plusieurs parametres peuvent appartenir k un meme graphe si tl est dosiro los voir 
ensemble. 

En outre, par defaut, sur chaque type d'objet (oracle. Tuxedo, system, ...), il est fait un certain nombre de controles 
d'etat. Si un de ces controles est negatif, il entraine le d^clenchement d'une action et I'objet en question (instance 
Oracle, application Tuxedo, ...) verra son icone changer d'6tat (et done de couleur) sur I'^cran d'administration. 
30 Ci-aprcs. il est donn6 des exemples de conditions attach6es ft un parametre. Le caract6re # veut dire "objectjdent . 

param_kjent". II n'est pas n^cessaire de specifier "objectJdent.param_ident" puisque que c'est le parametre courant. 



[PERIOD=n] ; 



param_condition ::= 



35 



( 

{# 

I GgtLastVahje (#) 

I GetDelta (#) 

I GetAverage (#. nval) 

I GetPercentRangeChange (#, min, max, init_value) 

I GetPercentLastChange (#, init_value) 

} 

{ op6rateur valeurl [HYSTERESIS=valeur2] 

I IN (min_val, max_val) } 

) 

ou (# op6rateur valeurl DURING=nsec) 



40 



45 
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# ou GetLastValue (#) : la derniere valeur mesuree. C'est la fonclion par d6faut si on ne specifie pas de fonction : 
"objid.paramid". 

GetDella (#): delta,, en valeur absolue. entre les deux demieres valours. 

GetAverage (#. nval) : moyenne des nval dernieres valeurs du paramelre. pas de moyenne sur plus de 20 valeurs. 
GetPercentRangeChange (#. min. max. init_value) : changement par rapport ^ un inten^alle de valeurs: {val2 - 
val1)/(max - min). 

GetPercenlLaslChange (#. init_value) : changement par rapport a la valeur precedente : (vai2 - val1)/val1. 
operateur : <, <=, >, >=, ==, 
valeurl : seuil 

HYSTERESIS=:valGur2 => la condition n'est vraie que si la valeur du paramfetre est precedemment relomb6e en 
dessous de "valeur2'' puis a re-atteint le seuil "valeurl". Pour ne pas (aire d'action en rafales. Par d6faul. rhyst6r6sis 
a la valeur du seuil ("valeurl "). 

DURING=nsec : est-ce que la valeur du parametre est "operateur" (plus grand par exemple) que le seuil pendant 
un temps donne "nsec" ? La (onction de base translorme le temps "nsec" en nombre "nval" de valeurs puis teste que 
les "nval" dernieres valeurs sont loutes "plus grandes" que le seuil. Rend 1 si vrai, 0 sinon. 

IN : est-ce que la valeur mesuree est comprise dans Tintervalle tmin_val, max_valj? 

Exemple : 

CREATE_PARAM OR714_NEW_PAR. or714_orage, 
MEASURE={SPECIF_FILE,/x/y/z,sql TS1 ). 
PERIOD=1h, TRACE. 



CONDITION=((# > 34). ACT10N=(UNIX_FILE , 'myprog act1 or714')): 



En ce qui concerne la condition simple : 
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single_condition ::= 
( 

{object_ident, paramjdent 

I GetLastValue (object Jdent, paramjdent) 

I GetDelta (objectjdent, paramjdent) 

I GetAverage (objectjdent, paramjdent, nval) 

[GetPercentRangeChange (objectJdent,paramJdent,min. 

max,init_value) 

I GetPercentLastChange (objectjdent; paramjdent, init_value) 
I GetOnlineValue (object_ident,paramJdent, [argument]) 
} 

{ op6rateur valeurl [HYSTERESIS=valear2] 

I IN (min_val, max_val) } 

) 

ou (objectJdent,paramJdent op6rateur valeurl DURING=nsec) 

GetLastValue (objid.paramid) : la derniere valeur mesurde. C'est la fonction par defaut si on ne specif ie pas de 
fonction : "obiid.paramid". 

GetDelta (objid.paramid): delta, en valeur absolue. entre las deux derni^res valeurs. 

GetAverage (objid.parannid. nval) : nnoyenne des nval dernieres valeurs du parametre. pas de moyenne sur plus 
de 20 valeurs. 

GetPercentRangeChange (objid.parannid. nnin. max, init_value) : changenaent par rapport a un intervalle de 
valeurs : (val2 - val1)/(max - min). 

GetPercentLastChange (objid.parannid, init_value) : changement par rapport a la valeur precedente : (val2 - val1) 
/vail. 

GetOnlineValue (objid.paramid, argument) : faire la mesure en temps r6el plutot que de chercher la valeur du 
parametre dans Ie tableau des mesures d6j^ faites. La fonction "GetOnline" ne peut pas se trouver dans une condition 
attachee k un parametre. Elle ne peut etre que dans une condition multiple (ou dans une action). Le parametre "pa- 
ramid" a ete documente comme acceptant ou non un argument. Voir ['option "ARG.REQ* de •CREATE_PARAM". 

Une condition multiple ne pourra pas contenir plus de dix conditions simples. 

Exemple : 

CREATE„COND ((or714„orage.NB_COMMIT_PER_SEC < 23) 
AND (GetAverage(syst_orage.CPU_BUSY, 10) < 95) ) 
ACTION=(UNIX_FILE , ^myprog new„server or714*) PERI0D=1h; 

De pr6f6rence le procede selon ['invention est utilise comme suit. L'administrateur decrit les objets ^ surveiller: 
"OBJECT objoctjd", ... II specific Igs modifications a apportor sur les attribute d'un parametre predofini, pour un objct 
donn6 "objectjd" : 

pour supprimer un parametre : MODIF.PARAM paramjd, objectjd, IGNORE; 

pour changer un attribut du parametre : MOD!F_PARAM paramjd. objectjd. TRACE, PERIOD=.-. 
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Ensuite il specifie les modifications a apporter sur une condition d'un parametre pr6d6flni, pour un objet donn6 
"objectjd" : 

pour supprimer une condition : MODIF_COND_PARAM condjd, object_id. IGNORE; 

- pour changer lout ou parlie do la condition : MODIF_COND_PARAM cond_id, objectjd, CONDITION=(^* > 45); 

ou MODIF_COND_PARAM condjd, objectjd. CONDITION=( # > 95 DURING=30sec), 
ou MODIF_COND_PARAM cond_id, objectjd, GONDITION=(# IN (0,350)); 

pour changer Paction associee : MODIF_COND_PARAM condjd, objectjd, ACTION=(...); 

Puis il specifie les modifications a apporter sur une condition multiple predefinie (el documentee) : 

pour supprimer une condition multiple : MODIF_COND_MULTIPLE condjd. IGNORE; 

pour changer Taction associee : MODIF_GOND_MULTIPLE condjd, ACTION=...; 

pour changer la p6riode de la condition : MODIF_COND_MULTIPLE cond_id. PERIOD= 5mn. 

Egalement, il cree un nouveau parametre a mesurer sur un objet donne : 

parametre sans condition, a analyser ("trace'): CREATE_PARAM param_id. objccl.id. MEASURE=^(...), PE- 
RIOD=5mn.TRACE....; 

parametre avec condition/action : CREATE_PARAM paramjd. objectjd, MEASURE=(...). PERIOD=5mn. CON- 
DITION=((obiectJd.paramJd > 95) ACTION=(UNIX_FILE , 'myprog actV). 

Enfin, il cree une nouvelle condition (multiple ou simple) sur des parameues (predednis ou nouveaux) : 
CREATE_COND ( (obj1.param1 > 95) AND (obj2.param2 > 80 during 3mn)) ACTION-(UNlX_FILE /myprog actV) 
PERIOD=15mn. 

Les actions sur condition peuvent etre explicitees comme suit. Une action est dectenchee si : 
une condition sur un ou plusieurs parametres (etat ou metrique) est vraie, 
une condition multiple est vraie, 

une erreur grave apparait dans un fichier "log" ou "trace". 

Pour une action d'une condition attachee a un parametre, les parametres envoyes a Taction sont : "objecl.ident", 
"paramjdent", "condition^n umber", "param_value", "seuil", "op6rateur", "object_specif_string". 
Pour une action d'une condition multiple, les parametres envoyes k Taction sont :"cond_ident"- 
L'action peut etre predefinie ou foumie par Tadministrateur. Elle peul comprendre : 

une demande d'affichage d'etat ("ok", "down", "warning") d'un ou plusieurs "objets a surveiller" ei done ralraichis- 
semenl de Ticone selon Tetat a afficher. Un "objet a surveiller" est toujours affiche sous forme d'icone. 

une correction predefinie, immediate, avec ou sans demande d'accord via Tinlerface GUI. 

une proposition predefinie de correction, a lancer en differ^, 

un envoi de message vers I'administrateur [interface GUI ou historiquo d'un produit ou connaissance d'une gostion 
do systcmcs intcgreo, courrior, signal sonoro ("beep"), ...], 

une action correctrice, compl6temenl decrite par I'administrateur. Cela peut correspondre a ajouler un serveur 
Tuxedo si le taux d'occupalion cpu n'esl pas sup^rleur a x %, 

un test de correlation sur d'autres informations "oraltuxisyst", puis si ce dernier est satisfait, action comme ci- 
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dessus. Done demander la valeur d'un autre paramfetre (■Iast_value", moyenne sur n valeurs, "delta", valeur "on- 
line*). 

ouvrir. sur I'ecran d'administration, un dialogue avec I'administrateur pour qu'il specifie las actions k faire. Cela 
permet dynamiquement de reagir ^ des problemes precis. Ceci ne devrait pas etre utilise systematiquemenl dans 
les actions. 

Quelques examples non limitalifs de realisation de parametres predefinis Oracle sont a present proposes : 

parametre "ORA.USER.ACCESS" dans lequel la mesure consiste ^ faire un essai de connexion au moyen de 
la fonction "con nect_st ring" fournie a i'utilisateur, la condition correspond ^ verifier si I'essai a ou n'a pas abouti et 
Taction reside en I'analyse de la cause et en la relance eventuelle. 

parametre "ORA_FREE_TS" dans lequel la mesure consi^te^ determiner le pourcentage d'espace libre par rap- 
port k la taille de I'espace table ("Tabtespace"), la conditioni est, si la mesure est < 5%, declencher actionl qui 
correspond ^ cr6er un tichier dans un systeme de fichiers ("FileSystem") utilise par I'espace table (Tablespace), 
alors que la condition2 est, si mesure < 10%, envoyer un message d'alerte (WARNING) vers I'interface GUI (GUI/ 
Events). 

parametre "ORA_FRAGMENT_TS" dans lequel la mesure consisle a verifier la condition qui correspond a ce que 
la plus grande des 6tendues (■MAX_EXTENTS") des tables de I'espace table ("Tablespace") soit plus petite que 
te plus grand trou de I'espace table, si cette condition est verifiee, envoyer une fenetre proposition d'action dans 
laquelle il est signifi6 qu'il faut reorganlser I'espace table ("Tablespace") selon les propositions sulvantes : 

* soit, il est cree automatiquemcnt un fichior pour agrandir Tespaco table ("Tablespace"), 

* soit. il est demande quand une commande standard "d'export/traitoment_tables/import" sera lancee. 

* soit, il est demande ^ I'administrateur de programmer le lancement de son utilitaire de reorganisation. 

parametre "ORA_SCANLOG" dans lequel les erreurs Oracled traiter dans le fichier "alert.log" sont pred6finies. 
A chaque erreur correspond une classe d'action pr6d6finie. Exemple : 

OR A-0603: ACT_RESTART1 
ORA-1600:ACT_ARCHIVE_!NCREASE. 

la mesure consislant k rechercher tes erreurs pr6deftnies dans le fichier "alert.log", la condition etant. si I'erreur est 
trouvee agir en appelant Taction predefinie ou externe liee a la classe d'action de l*erreur trouvee (ACT_RESTART1 
=> relancer I'instance par startup). 

Egalement. suivent des exemples non limitatifs de fonctions de base. Ces fonctions de base peuvent elre utilisecs 
dans les actions fournies par Tadministraleur. L'administraleur ne peut pas utiliser de fonctions demandant plus de 
valeurs que ce qui est possible pour un parametre (voir "NB_VALUES"). Ces fonctions de base sont egalement utilisees 
en interne dans les actions par les modules sp^cifiques et Tagent g6n§rique. Voir les paragraphes ci-avant relatlfs aux 
conditions pour certaines fonctions de base utilisees dans les conditions. 

Une fonction de base comme "GetLastValue" peut demander la valeur d'un parametre relatif k un objet surveille 
par un autre noeud. 

Ces fonctions doivent pouvoir etre appelees dans un programme C et dans un programme "shell". 

GelLastValue (objectjdent, paramjdenl, &result_int) : retourne la derni6re valeur mesur6e d*un parametre. 

GetAbsDelta (objectjdent, paramjdent. &result_int) : retourne la valeur "difference entre les deux derniferes va- 
leurs" du parametre (en valeur absolue). 

GetSlgnDelta (objectjdent, param_ident, &result_int) : retourne la valeur "difference entre les deux dernicres 
valours" du paramctro (valour avcc son signc), 

GetAverage (objectjdent, paramjdent, Sresult Jnt, nval) : retourne la moyenne sur les "pval" dernieres valeurs 
d'un paramdire. Limite : "nval" ne peut pas §tre plus grand que 20. 

GetOnlineValue (objectjdent, paramjdent. &result Jnt, argument) : retourne la valeur de la mesure en temps r6e! 
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plutot que de chercher la valeur du paramelre dans le tableau des mesures deja faites. Le param^tre "param Jdenf 
a ele documento comme acceplant ou non un argument (voir roplion "ARG^REQ" de "CRE ATE_PARAM'). Cette 
fonclion ne fail que-faire la mesure. ce qui signtfie que si ce paramelre a des conditions/actions, elles ne sont pas 
evaluees. On peul faire -QetOnlineValue" sur un paramelre (el un objet) qui a Poplion "IGNORE" (cela veul done 
dire que le module specifique a la description du paramelre, sans les condilions/aclions). 

GelPercenlRangeChange {objecl_idenl. paramjdenl. &resull_lnl, min. max. iniLvalue) : changemenl par rapport 
a un inlervalle de valeurs (val2 - vail )/(max - min). Val2 est la valeur mesuree. "val1 " est la mesure pr6cedenle. 

GetPercenlLastChange (objecUdenl. paramjdenl. &resultjnt. init_value): changemenl par rapport a la valeur 
prec6dente : (val2 - vail )/val1 . 

SetVarSlring (objecljdent, vanable_name, strlng_value) : mettre une valeur dans une variable d^finie. par I'utili- 
saleur. Cette variable sera utilis6e dans la fonction "GetVar" pour connaTlre la valeur. Ce m6canisme peul etre 
utilis6 pour transmettre des informations enlre une mesure el une action, entre deux mesures. entre deux actions. 
L'6lendue d'une variable est Pidentitiant d'objel ('objectjdent-). Les variables sont cham6es k un objet pr6cis. 
L'ulilisaieur ne peul pas taire "SetVarSlring" sur une variable dont le nom commence par l_, ceci, afin de proleger 
tes variables affeclees par un module specifique. 

SelVarlnl (objecljdenl, variable_name. inl_value). meme chose que pour "SelVarSlring" mais la valeur esl un 
entier ("int"). 

GetVarString (object Jdent. variable_name, &string_ptr): retourne un poinleur (dans "string.ptr") sur la valeur de 
la variable. 

GelVarInt (objecljdenl, variable_name, &int_value): retourne un entier qui est la valeur de la variable. 

GetCurrentObjeclId () : rend I'identifiant d'objet ("object Jdent") de I'objet courant traile par le module specifique 
dans Taction. Permet. dans une action, de tester la valeur d'un autre paramelre du meme objet par "GelLaslN^lue 
(GelCurrenlObjectld().ORA_COMMITS)V 

GelLocalNodeObjectld () : rend ridentifianl d'objet ("object Jdent") de I'objet sysleme du noeud local. Permet dans 
une action de tester la valeur du cpu sur le noeud local par I'intermediaire des lonclions sulvantes : "GelLaslValue 
(GelLocalNodeObjectld().SYST_CPU_BUSY)". 

TestDuring (objecLidenl, paramjdenl. time, operator, threshold): retourne la valeur vral (1) ou faux (0) de la 
condition : est-ce que la vaieur du paramelre esl "operator", plus grand par exemple que le seuil pendant un temps 
donne. La fonclion de base transforme le temps en nombre n de valeurs puis teste que les n derniferes valeurs 
sont toutes "plus grandes" que le seuil. 

Trace (objecljdenl. paramjdenl. type_value. param_value) : mettre la mesure d'un paramelre dans le fichier 
"trace" pour analyse independante (nom du fichier : •appLsurvey.<node>.<dateotday>.params.trc'). La fonction 
de base ajoule le nom de la machine, la date/heure. Type_value est un entier : 1 (int) ou 2 (float) 

StopObjSurvey (objecljdenl): I'agent generique envoie cette fonclion vers I'inlerface GUI pour qu'elle affiche I'etal 
do I'objet en icone. L'agent generique mel d'abord le champ -survey_slalus- a 1 (stop) pour I'objet. Le champ 
"sun/ey.stalus" peul 6ire : 0 (objol sous sun/oillance), 1 (objet £i no plus survoillor). 2 (objol donl la survoillanco 
doil demarrer : par "slarl_survey"), 3 (objet donl on ne traile pas les param^lres). 

DisplayGraph (objecljdenl. paramjdenl. param Jype. param.value) : afficher la valeur du paramelre, par I'inter- 
mediaire de Pinlerface GUI. La fonclion de base envoie egalement la date/heure. 

DisplayStato (object Jdent. paramjdenl, objlypo. sovorilyjovcl, msg. linol val. Iinc2val) : romontor l'6tal d'un ob- 
jet. pour que I'inlerface GUI le visualise. L'inlerface GUI modifie I'etat de I'icone associ6 ^ I'objet. "Objtype" est. 
par exemple, ORACLE, SYSTEM. TUXEDO, etc. "Msg" est une informalbn delaillee sur I'etat de Tobjel: via le 
"boulon2" (rriilieu). I'inlerface GUI affiche cette information. L'action d'afficher se fait sur la machine d'administra- 
tion. "Linel val" el ''Iine2val" (lignes sous I'icone) sont les valeurs des deux lignes : "NULL" veul dire ne pas afficher 
la ligne sous I'icone. 
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DisplayStatelnternalSon (objectjdent. internaLobjid, paramjdent. internaLobjtype. father_sev_leve!. 
internal_sev_level, msg, linelval, tine2val) : remonter Tetal d'un objet. pour que I'interface GUI le visualise. L'in- 
terface GUI modifie I'^tat de I'icone associ6 k Tobjet. "InternaLobjtype" est, par exemple. *TUX_MASTER", 
"TUX_NODE". "TUX.QUEUESPACE". "Msg" est une information d6tatllee sur I'etat de I'objet : via le "bouton2" 
5 (nnilieu). I'interface GUI affiche cette infonmation. faction d'afficher se fait sur la machine d'administration. 

"Linetval" et *'Iine2val" (lignes sous I'icone) sont les valeurs des deux lignes : "NULL" veul dire ne pas afficher la 
ligne sous I'icone. 

RemovelnternalSon (object_ident) : informer I'interface GUI que I'objet pere etant "DOWN" (panne), il n'est pas 
10 possible d'acc^der aux fils internes. II faut done ne plus voir les icones associes aux objets tils internes. 

SendHisto (severity, object Jype, message. ack_required) : remonter un message dans I'historique d'un produit. 
"objectjype" identifie le module sp6cifique (oracle, tuxedo, systeme, ...). 

^5 - SendlsmAlarm (severity, object_type, message. ack_required) : remonter une alarme vers I'alarme d'un produit 
de gestion de syst^mes Int6gr6e. "object_type" identifie le module specitique (oracle, tuxedo, systeme, ...). Seve- 
rite ^ preciser. 

SendMsg (severity, object_type, message, ack_required) : si "severity" est W ou I : "SendHisto". Si "severity" est 
^0 A ou E et si produit de gestion de systfemes int^gree present, en tant que "super geslionnaire". alors "SendlsmA- 

larm" sinon "SendHisto". Si "ack.required^l" : un icons drapeau (produit de gestion de systemes integree ou 
historique d'un produit) se leve indiquant qu'un message est a acquitter dans I'alarme du produit de gestion de 
systemes Integree ou dans I'historique d'un produit. 



DisplayMcssage (message) : afficher sur la machine d'administration unc fcnctrc contcnant Ic message et un 
bouton "OK" pour supprimer la fenetre. 

AskForCommand (message, r^ponse) : afficher sur la machine d'administration une fenetre contenant le message 
demandant si Tadministrateur est d'accord pour qu'on execute telle commande. Retourno la roponso (1 oui, 0 : 
non) ^ la question. Selon la r^ponse, faire ou non la commande. Si aucune reponse n'est recue apres un delai 
d6termin6. la commande n'est pas effectuee. 

"prevenir Tadmin" ("mail", "beep", "msg console", ...) 

Suivenl pour une bonne apprehension du proc6d6 divers exemples de configuration. Le premier exemple concerne 
Oracle : 



OBJECT or71 6_orage, NODE=orage, 

DESC=(ORACLE, ORACLE_SID=or716, ORACLE_HOME=/ora716, 
UNIX_ADMIN_USER=ora716, ORACLE_USER=sys, 
ORACLE_PASSWORD=change_onJnstaII, 

CONNECT_STRING=P:or716. TNS_ADMIN=/ora716/nGtwork/admin) 

DISPLAY=(GRAPH=(graph_or716. TITLE=or716 graph) ); 

- modifier la p6riode d'un contr6le (mesure du paramfetre d'6tat 

"ORA_CONNECT_STATUS" pr6d6fini par le module sp6cifique Oracle et 

document^) : 

MODIF_PARAM or716_orage, ORA_DB_ACCESS. PERIOD=1h; 

remplacer dans la condition la valeur du seuil d'espace libre : 

MODIF_COND_PARAf^ or716_orage. ORA_TS_FREE_TOOLS, 1. CONDITION = (# < 15); 
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creer un nouveau paramelre avec une condition/action : 

CREATE_PARAMor716_orage. USER_TS_SYSTEM_BLOCKS. 
MEASURE=(SPEClF_FILE./x/y/2.sql) 

[TRACE], PERI0D=12h, CONDITION=((# > 320) ACTION=(UNIX_FlLE . 
7x/y/alLactions.sh act_ts_system_blocks')); 



remplacer I'action pred6tinie qui 6tait d'6mettre un message vers rhistorique tfun produit. En fournir une autre qui 
consiste a poster dans la -crontab" rexficution d-un utilitaire Oracle sur les espaces table (-tablespaces") trop 

''^^"^MODIF.COND.PARAM or716_orage, ORA_ALL_TS_FRAGMENT, ACTION=(UNIX_FILE. 7 
oraclelaclion_ora aclion_name') ; 

supprimer le traitemeni d'un param6tre predefini : 

MODIF_PARAMor716_ora9e. ORA_TS_FREE_SYSTEM. IGNORE; 

modifier Ics options par dofaut du trailcmcnt d'un paramctrc prcdclini : 

MODIF.PARAM or716_orage. ORA_TS_FREE_SYSTEM, TRACE, DISPLAY=(TS minfree, GRAPH= 

(graph_or716));; 

Le second exemple conceme I'ensemble Tuxedo/Oracle/Syslem 

decrire un objel global ( par exemple "flowbus.appli") constilue par une application "Tuxedo tux_demo_(b" (dont 
le "master node" est orage) qui utilise une base "Oracle or714_ora9e- el loumanl sur le noeud "syst_orage . A 
chaque objet est associe un graphe de courbes de mesures. Les objets (leur icone) "lux_demoJb' et 
"or714_orage" ne sonl visualises que si rutilisaleur demande un zoom apres avoir cliquer sur Tobjet global 
("flowbus_appli") : 

OBJECT syst_orage, NODE=orage, 
DESC=(SYSTEM) 

DISPLAY=(GRAPH=graph_orage. TITLE=orage perfs ): 

OBJECT tux_clemo_fb, NODE=orage 

DESC={TUXEDO. 

TUXCONFIG=/flowbus/val/test/marcel_demo/bin/TUXCONFIG. 

TUXDIR=//usr/tuxedo. 
APPDIR=/flowbus/val/test/marcel_demo/bin, 

UBBFILE=/flowbus/val/test/marcel_demo/bin/UBBCONFIG. 

LANG=C. UNIX_ADMIN_USER=fb_user. 
QMCONFIG=/flowbus/val/test/marcel_demo/bin/QUE, 
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LIBPATH=/flowbus/val/test/marcel_demo/bin:/usr/tuxedo/lib:/ 
flowbus/install/Iib.7:/lib:/usr/lib;/usr/lib/cobo!/coblib), 
DISPLAY=(GRAPH=(graph_tux_denno_fb. TITLE=tuxedo demo_fb 

stats); 

OBJECT or714_orage, NODE=orage 

DESC=(ORACLE. ORACLE_SID=or714. 
ORACLE_HOME=/ora714. UNIX_ADMIN_USER=ora714, 
ORACLE_USER=sys. 
ORACLE_PASSWORD=change_onJnstall, 

CONNECT_STRING=ior714, 
TNS_ADMIN=/ora714/network/admin) 

DISPLAY=(GRAPH=graph_or714. TITLE=or714 perfs ); 
OBJECT flowbus_appli, 

DESC=(GLOBAL_OBJECT. COMPONENTS=((syist_orage. 
DOWN),(tux_demo_fb. DOWN). (or714_orage. WARNING)), 
DISPLAY=(GRAPH=graph_fIowbus_a. TITLE=global flowbus_a 
perfs ); 

creer un nouveau paramdtre nombre de messages dans la queue Q1 , sans condition/action : 

CREATE_PARAM tux_demo_fb. Q1_MSG_NB. MEASURE=(UNIX_FILE 
/x/y getjg Q1) 

[TRACE]. PERIOD=60s. DISPLAY=(nombre de messages dans 
Q1, GRAPH=(graph_tux_demo_fb): 

afficher des paramfetres dans des graphes de mesures : 

MODIF_PARAM syst_orage, SYST_CPU_BUSY, DISPLAY=(cpu busy, GRAPH=(graphJlowbus_a, 
graph_6rage)); 

MODIF_PARAM sysl_orage, SYST_IO_HDISKO, DISPLAY=(hdiskO ; KB/sec, GRAPH=(graph_riowbus_a, 
graph_orage)); 

MODIF_PARAM or714_orage. ORA_SRV_NB. DISPLAY=^(nombre de serveurs oracle dedies, GRAPH= 
(graph_flowbus_a, graph_or714)); 

MODIF_PARAM or714_orage, ORA_COMMIT_PER_SEC, DISPLAY=(nombre de commits/sec. GRAPH= 
(graph_or714)); 

MODIF^PARAM tux_denno_fb. TUX_TPS, DISPLAY=(nombre de services/sec, GRAPH=(graphJlowbus_a, 
graph_tux_demo_fb)); • 
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MODIF^PARAM tux_demoJb. TUX_CLIENT_NB, DtSPLAY=(nombre de clients Tuxedo. GRAPH= 
(graph_flowbus_a. graph_tux_demoJb)); 

MODIF.PARAM lux_demo_fb, TUX_SERVER_NB, DISPLAY=(nombre de serveurs Tuxedo, GRAPH= 
(graph.Jlowbus_a, graph_tux_.demoJb)); 

Los graphes suivanls seront afliches si i! est cliqu6 sur le "boutonS" des objels : 

Graphe "graph_flowbus_a" : "click" sur "objet flowbus_appli" 

cpu busy 
hdiskO : KB/sec 

nombre de serveurs oracle dedi6s 
nombre de services/sec 
nombre de clients Tuxedo 
nombre de serveurs Tuxedo 

Graphe "graph.orage" : click sur "objet syst_orage" 

cpu busy 
hdiskO : KB/sec 

Graphe "graph^tux.demojb" : "click" sur "objet tux.demojb" 

nombre do mossagos dans Q1 
nombre de services/sec 
nombre de clients Tuxedo 
nombre de serveurs Tuxedo 

Graphe graph_or714 : "click" sur "objet or714_orage" 

nombre de serveurs oracle dedies 
nombre de commits/sec 

Le troisieme exemple est relatif a FSX. 
OBJECT fs_oracle_orage NODE=orage DESC=(FILESYSTEM. NAME="/oracle". MIN_FREE=20, MAXSI- 
ZE=300MB. INCRSIZE=1MB); 

modifier la periode du controle (mesure du paramelre "FS_FREE_SPACE") 
MODIF_PARAM fs_oracle_orage, FS_FREE_SPACE. PERIOD=1h; 

- remplacer Taction pr6definie qui est d'agrandir le sysleme de fichiers, jusqu'a la taille maximale. En fournir une 
autre qui consiste ^ tester que tel fichier "log" ne grandit pas anormalement. auquel cas, voir si le niveau de "trace" 
est correct et si ce n*esl pas le niveau de "trace" qui n'est pas adapts, alors ... 

MODIF_COND_PARAM ts_oracle„orage. FS_FREE_SPACE. ACTION=(UNIX_FILE. Voracle/actionjs 
aclion_name') ; 

remplacer la valeur du seuil "minfree" : 

MODIF_COND_PARAM fs_oracle_orage, FS„FREE_SPACE, CONDITION=(tf < 15 HYSTERESIS=18) ; 

En fonctionnement autonome ("offline"), la collecte des paramfetres se fait dans un fichier "paramlog" sur chaque 
noeud surveill6. Las actions sont enregistrees dans un (ichier "actionlog" sur chaque noeud surveilld. en particulier 
pour : 

permettre la gestion d'archives sur une periode plus ou moins longue. I'affichage d'activites pass6es, les rapports 
de statistiques (sur un jour/semaine/mois/an el diff6rents zooms sur les informations "systeme/DB/TP/EpochBac- 
kup/). Permettre les statistiques par application Tuxedo, par instance de base de donndes, par application X ou 
Y, par "machine/cluster". Permettre la collecte/analyse d'informalions pour sun/eiller que la mise au point ("tuning" 



19 



EP 0 822 498 A1 



SGA. ...) est loujours correcte (via un appel ^ "DbaExpert" ou autre). Stocker las recommandations. 

L'agent autonome conforme k rid6e de Tinvention se compose principalement d'un agent generique et d'une p!u- 
ralite de modules sp6cifiques ^ chaque type d'objet : oracle, tuxedo, systeme. DPR FSX. SAP ... Le travail global 
5 consiste k mesurer des parametres. si besoin est les stocker dans un tichier "trace" et permettre leur affichage par 
rinterm^diaire de I'interface GUI. k evaluer les conditions simples ou multiples et ^ lancer Taction liee a la condition 
vraie et ceci pour tous les objets d^rits dans le fichier de configuratiton. 

L'agent generique "d'administration" (sur le noeud d'administration) gbre les donnees d'entree suivantes: 



10 - d'un c6t6 toutes les donn6es qui ont et6 predefinies par chaque module specifique. pour tous les objets du meme 
type : 
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des paramfetres avec leurs attributs {p6riode de mesure. analyse (traceyaffichage avec sa periode). Chaque 
parametre a un identifiant de parametre. L'administrateur peut modifier des attributs de ce parametre. 

6ventue!lement, une condition simple associee S un parametre ou une condition multiple sur plusieurs para- 
metres, ainsi que Taction liee ^ ta condition. Une condition simple ou multiple est identifiSe (identifiant du 
parametre pour une condition \\6e S un parametre ou identifiant de condition pour une condition multiple) : 
Tadministrateur peut modifier des attributs de cette condition. 



d'un autre c6t6 toutes les donn6es qui ont 6t6 sp6cifi6es par Tadministrateur : 

* des modifications sur les attributs pr6d6finis : analyse ("trace"), penode, affichage, les donndes pour un objet 
particulter ou la suppression d'un parametre. 

* des modifications sur les conditions prddofinios : changer lo souil d'uno condition simple, Taction, la poriodo 
ou supprimer la condition. 

* des creations de parametres avec eventuellement une condition simple 

* des creations de conditions simples ou multiples avec une action associee. 

Le traitement de Tagent gen6rique d'administration se fait de la maniere suivante: 

05 - lecture de son fichier de configuration. Analyse syntaxique et semantique ("MODIF.PARAM" d'un parametre 
inexistant, ...). 



fusion du fichier de configuration fourni par Tadministrateur et du fichier de conliguration fourni par les modules 
specifiques. 

40 

envoi du fichier de configuration resultant d chaque agent (en filtrant relativemonl aux objets a surveiller sur la 
machine et en tenant compte des problfemes inherents aux noeuds en panne ou aux noeuds pr6vus pour la sau- 
vegarde des donnees d'un noeud en panne sur un autre noeud). 

45 Le traitement de Tagent g6n6rique d'un noeud autre que le noeud d'administration se fait de la maniere suivante : 

lecture de son fichier de configuration, seuls les objets locaux ^ ce noeud soni trail6s. 

construction de la table d'objets ("OBJECTS"). 

so 

construction de la table de configuration des parametres ("CONFIG.PARAM'). 



construction dc la table dos valours do parametres ('PARAM_VALUES"): 

* chaque parametre de chaque objel a au moins un emplacement pour mettre sa/ses valeur(s). S'il y a des 
fonctions comme moyenne ("paramid", 20) ou dur6e d'ex6cution. alors le nombro d'emplacements a rosorvcr 
pour ce parametre de cet objet est calcul6. 



20 



EP 0 822 498 A1 



construction de la table des conditions nnultiples ("COND.MULTIPLE"). 

fourniture des foncllons de base a I'usage des naodules specifiques pour certaines et pour les actions extemes 
pour d'autres. 

lancennent des modules specifiques : 

* les modules specifiques "lourds" comme Oracle. Informix, Tuxedo possedent un traitement propre. D'autres 
comme FSX, DPF peuvent etre regroupes dans un seul traitement. Le but est de ne pas s6rialiser toutes les 
surveillances mais d'en faire un certain nombre en parallele. L'ensemble global ne doit quand mdme pas 
consommer plus que le taux maximal ("MAX.CPU") de cpu autorise. 

* ne lancer que les modules qui ont un objet a surveiller. 

■ configuration a partir du service de surveillance de fichiers, par exemple RSF ("Remote System Facility"), de 
maniere a permettre le traitement de I'exploralion des tichiers de journalisation Clogs") de tous les objets d6crits. 

evaluation de chaque condition multiple, avec sa p6riode : 

* chercher les valeurs des paramelres dans la table des valeurs de paramfelres ("PARAM_VALUES") ou via la 
fonction "gel_online". 

* si la condition multiple est verifide : lancer Taction (interne ou exlerne). 

survcillancG reguliere du bon fonctionnement des modules specifiques (envoi d'un parametre special et attonte 
de la reponse). 

Outre les fonctions de base fournies a Texterleur. I'agent generique et les modules specifiques utilisent les fonctions 
de base internes suivantes : 

- PulValue (object Jdent. paramjdent, param_value) : ranger dans la table "PARAM.VALUES" la derni6re valeur 
d'un parametre donn6 d'un objet dpnne. Cette fonction est utilisee par les modules specifiques apres la mesure 
du parametre. 

ExecMeasure (param_entry) : voir "traitement d'un parametre". 

- ProcessHysteresis (object Jdent, paramjdent. param.value) : si le champ "action" n'esl pas valide 
("ACTION_SWITCH OFF") alors tester "param_:value" avec I'hysteresis. Si inferieur (en fait op6rateur Inverse de 
celui pour le seuil) valider ce champ ("ACTION.SWITCH ON") sinon I'invalider ("ACTION_SWITCH OFF"). 
"ACTION^SWITCH" est un champ de la structure condition et est initialise ^ "ON". Si on place "ACTION.S WITCH" 
a "ON" pour une condition, il faut faire de m§me pour les conditions de rang sup6rieur, c'est-a-dire les conditions 
2 el 3 si on met "ACTION_SWITCH" a "ON" pour la condition 1. 

- EvalConds (param_entry) boucle sur les conditions d'un parametre et appelle "EvalCond" (voir "traitement d'un 
parametre"). Cette lonclion permet de tester le champ "aclion_switch" de rentr6e parametre avant de lancer Tac- 
tion. 



EvalCond (Gond_enlry) evalue (vrai/faux) une condition. 

ActionCondParam (object Jdent. param Jdent, condition_number. param.value. condition_buffer, 
object_specif_string) et ActionCondMultiple (action_name, action Jype. condjdent) : Ces fonctions permettent 
do lancer une action. Si "actionjype" est intorno ("intornar. pr6d6fini par le module sp6cifique) alors appele^r un 
point d'entroo intorno au modulo spdcifique on lui passant les arguments "object Jdent", etc.. Si "action^typo" est 
Gxterne ("external", fourni par I'admintstrateur) et si un fichier specifique est concerne ("SPECIF_FILE"), appeler 
un point d'entrde du module spdcifique qui traite le fichier de commande, mais si c'est une commande sp6cifique 
qui est concem6e ("SPECIF.COMMAND"), appeler un autre point d'entree du module sp6cifique qui traite la 
commande. Dans le cas ou un fichier Unix ou une commande Unix ("UNIX_FILE" ou "UNIX.COMMAND") sont 
concernes, ouvrir le fichier de synchronisation appele aussi "lube' par I'homme du metier (commande "popen" qui 
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est la contraction de "pipe open") sur la chame fournie en ajoulant comnne arguments ce qui pernnet de caracteriser 
le contexte : "object Jd". "param.id". ... La fonction de base enreglstre dans le fichier "actionlog" du noeud local 
le fait que cette action est ex^cutee : nom du fichier 'actionlog appl_survey.<node>.<dateofday>.act(cns.trc". 

Ces fonctions de base sent utilisees par les modules specifiques at doivent pouvoir etre appelees dans un pro- 
gramme C. 

Le traitement d'un module sp6cifrque (syst6me Unix, courrier, FSX, impression DPF [Distributed Print Facility], 
oracle [base de donn6es], Informix [syst6me de bases de donn6es Unix], Tuxedo [application], FlowBus [gestionnaire 
de flux interapplication], XCP2 [extended Cooperative Protocol level 2], SAP [Sen/ice Access Point], ...) se fait de la 
maniere suivante : 

exploration de la table de configuration des param^tres ("CONFIG_PARAM''), en ne traltant que ses propres 
objets : 

* paramdtres d6j^ tri6s par perlode croissante. 

* pour chaque parametre de chaque objet, selon la periode : 

faire la mesure en utilisant la commande interne (paramfetre pr6d6fini) ou externe ("CREATE_PARAM"), 
la meltre dans la table "PARAM.VALUES". 

si une analyse ("trace") est effectuee. mettre la valeur dans le fichier "trace" global de I'agent autonome 
(voir fonctions de base). 

si un affichago est domandd, afficher la valeur ou I'dtat. 

evaluer la condition simple, si elle existe, lancer I'action (interne ou exteme) si la condition est vraie. 

traitement des demandes tnopinees ("get_online") de mesure en temps reel de paramfetre. 

Le traitement d'un parametre est effectu6 de la sorte : 

si le parametre est valide et la periode determinde : 
si param.valid_param_entry & param.period_OK 
alors return_code = ExecMeasure (param_entry) 

si une condition sur un parametre existe et que le parametre est valid6 

si param.cond_exists & param.valid_param_entry & (return_code == 0) 
alors EvalConds (param_entry) 

Le contenu de la fonction de base "ExecMeasure" pour realiser la mesure de parametre est plus precisemenl 
explicite ci-dessous : 

si param.measure_type="internal", alors 
status=param.measure_cmd(param.param_ident.objectJdent.&param_value) 

sinon status=ex6cuter param.measure_cmd (programme shell ou binaire) avec pour argument : (param_ident, 
robject_ident). lancer en redirigeant sa sortie dans un "pipe". Convention : le programme externe met sa valeur dans 
sa sortie standard et la valeur du param6tre mesur6 est r6cup6r6e en lisant le fichier "pipe". 

si (status == 0), alors 

PutValue (param.object_ident, param.paramjdent. param_value) si param.trace alors Trace(param. 
objectjdent, param.param_ident, param_value) 

si param.param_display alors DisplayGraph (param.object_ident. param.param_ident, param_va!ue) 
Le contenu de la fonction de base "EvalConds" pour 6valuer les conditions sur les paramfetres est plus precisement 
cxplicit6 ci-dossous : 
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pour i=1 S nbconds 

ProcessHysteresis (param.objectjdent, param.paramjdent, 

param_value) 

si ACTION^SWITCH OFF ==> next condition 
bool = EvalCond (param.cond_entry(i)) 



si (bool == true) & (action_switch == ON) alors 
{ActionCondParam (param.objectjdent, param.paramjdent, 

param.condition_number, param^value, param.cond_entry(i), 

object_specif_string) 
ACTION^SWITCH = OFF 
break 

} 

Suivont deux exemples de code, le premier relatif au code de la commande de mesure ("measure.cmd") du 
module specifique, plus particulierement du module sp6cifique "FILESYSTEM* (FS): 

dispatch (paramjdent) 

FS_FREE_SPACE : 

appeLmesure param.name free_percent. currsize 
si mesure KO ("name" non trouv6 ou pas mont6) alors 

SendHisto (AS, "Filesystem %param.name not found in 

%param.node machine") 

param.measure__rc=DOWN 

return -1 

sinon *param_value = fr6e_percent 
return 



Le second example est relatif au code "d'action du module specifique" : 
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dispatch (action_name) 

FS_FREE_SPACE_ACT1 : 

si (currsize < obj.maxsize) alors 

si ((currsize + obj.incrsize ) > obj.maxsize) alors incr_t=obj.maxsize - 

currsize 
sinon incr_t=obj.incrsize 
appel chfs_command (name, incr_t) 
retum. 



A ce stade de la description, plusieurs remarques sont a faire : 

la mesure envoie les messages si un probl6me est rencontre dans ladite mesure. 

si n conditions sont impos6es. une seule action est effectu6e, celle de la premiere condition vraie ("condl " puis 
"cond2" puis "condS"). 

les champs suivants sont k pr6voir dans I'entr^e "param" : 

measure_rc (OK.KO) 
param_state (state, metric) 

action_switch (ON.OFF) : initialise k ON. mis k OFF si la valeur du parametre est inf^rieure (en fait op6rateur 
inverse de celui pour le seuil) k I'hyst6r6sis. Par defaut. I'hyst6r6sis a la valeur du seuil. 
Le champ '•action_sw'' est test6 dans la fonction de base "EvalConds". 

un paramdtre "state" a toujours ses deux dernieres valeurs dans la table "r^sultat". 

a un instant donn6, I'acces est autorise k une entree objet et a une entr6e parametre. 

lorsqu'un agent est deports sur le noeud d'administration pour surveiller une pluralite de noeuds, il peut etre ne- 
cessaire de pr^voir un gestionnaire (manager) SNMP qui dialogue avec les agents SNMP standard sur les noeuds 
concernes. Get agent deporte gere les fichiers "paramlog" et "actionlog" sur le noeud d'administration. 

Le trailement des actions est realise comme suit : 

- I'agent g6nerique et les modules sp^cifiques demandant ^ lancer une action (predefinie ou fournte par I'exterieur). 

- toute action regott des arguments qui repr6sentent le contexte qui d6clenche Taction : 

. ridentifianl d'objet (objectjdent). I'identifiant du parametre (param_ident), le num^ro de la condition 
(condition_n umber, si condition multiple). 

pour une condition simple : la valeur mesur6e du paramfetre. son seuil et son hysteresis, I'operateur (>,<,=. !=). 

Le lancemenl d'une action est traite par une fonction de base : voir ci-avant avec les fonctions de base " Action- 
CondParam" et "ActionCondMultiple". 

En ce qui conccrnc Ig traitcmcnt des fichiers do journalisation ('togs") dos applicatifs. pour chaquc modulo spo- 
cifique. toute erreur speciflee dans le fichier ■ERROR_CONTROL' qui apparait dans un fichier "log" de I'objet ("alert, 
log", -ULOG-, ...) genere I'execulion d'une action. Pour chaque objet k surveiller. I'administrateur specifie la liste des 
fichiers "logs- k explorer CSCANLOG" dans la commando "CR.OBJECT" de la configuration) et un fichier de controle 
d'erreur ("error control file'). Des valeurs par d6faut sont pr^vues. Ce fichier de controle d'erreur decrit les erreurs k 
s6lectionner (les "ora.err" par exemple) et la classe d'erreur associ^e k chaque erreur Cette classe d'erreur sera 
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transmise a Taction Ii6e a la condition du parametre pr6defini "PARAM.LOG" el servira a un aiguillage plus fin sur la 
sequence de traitements a fairs qui consiste, par exemple. a sauver des fichiers d'analyse ("trace") ou des informations 
complemenlaires. La sequence de trailennents dans Taction est predefinie mais peut etre entierement 6crile par I'ad- 
ministrateur. II est important de rappeler que loute action declenchee entraine I'enregistrement ("logging") dans le 
5 fichier "actionlog" avec le message d'erreur dans ce cas. Un exemple de fichier de conlrole d'erreur ("error„controLfiie") 
est ct-apr6s propose : 

"ORA-OeOS'iACT.RESTARTI 

•*ORA-1600":ACTJNCREASE_ARCHIVE 

10 Avant de lancer les modules specifiques. I'agenl generique g6nere une configuration "RSF" pour chaque objel si 

le fichier "SCANLOG" est decrit pour I'objel. 

si le fichier "LOGFILE" decrit les noms des chemins des fichiers de journalisation ("logpalhname") : une entrde 
dans la configuration "RSF" par le nom du chemin de fichier de journalisation ("logpathname"). 

15 

si le tichier "LOGFILE" n'est pas decrit, fagent generique appeile une fonction du module specifique ('mstype" est 
le type du module sp6cifique) "<mstype>_buildJognames (object_entry, lognames.array)" qui retourne une liste 
de noms de fichiers a explorer, comme par exemple avec Oracle : 
$dbhome/rdbms/log/alen_<sid>.log, 
20 $dbhome/nelwork/!og/listener.log,$dbhome/ 

sqlnet.log. etc... L'agent generique appelera, par exemple, I'application Tuxedo chaque jour juste apres minuit car 
le nom du fichier "log" conlient la date du jour 

La configuration "RSF" est personnalisee par le fichier "error_controUileV Si une erreur est trouvee dans un nom 
2S do chomin do fichier do journalisation ("logpathnamo"), un messago est gcncro vers lo fichier "ApplicationJournar ot 
un message est genere dans le fichier "error_param_<mstype>" sur le noeud a surveiller et dans le fichier "AS_scanlog" 
dans le repertoire "GULFILES.DIR" sur le noeud d'administration. de fornr^t : 
object_id error_code act_class logpathname ligne_contenant J_erreur 
Puis I'agenl generique lance le traitement de la configuration 'RSF". 
30 Le module specifique a predefini un parametre "PARAM_LOG' (qui est ignore si Toption "SC ANLOG" n'existe pas 

pour robjet). Dans ce cas, il effectue une mesure qui consiste a lire un message dans le fichier "error_param_<mstype>'' 
sur le noeud a surveiller. pour I'identifianl d'objet ("objectjd'*) courant. Le module specifique gere un point couranl par 
ridentif iant d'objet ("object„id"). SI la condition posee "message Irouve" est verifiee. Taction associee est appelee, avec 
comme arguments le contexle classique, le code erreur ("error_code"), la classe d'actlon ("acl_class"), le nom de 
3S chemin de fichier de journalisation ("logpathname") et la -ligne_contenant_Lerreur". L'action predefinie va permettre 
d'enregistrer le fail que la ligne a ete trouvee. Cette action predefinie peut elre remplacee par I'administraleur par une 
action externe. 

En ce qui concerne I'analyse autonome ("offline"), la collecte des parametres se fait dans un fichier parametre sur 
chaque noeud surveille. Les conditions vraies sont enregistrees dans un fichier d'analyse ("trace") sur chaque noeud 

-to surveille. Une telle analyse autonome est utilis6e pour la gestion d'archives sur une periode determinee, pour I'affichage 
d'activltes passees, pour les rapports de statistiques (sur un jour/semaine/mois/an et diff6rents zooms sur les infor- 
mations relatives au "syst6me/DB/TP/EpochBackup/). Des statistiques peuvent etre ainsi elablies par application Tuxe- 
do ou pour une quelconque application, par instance de base de donnees, par "machine/cluster", etc.. La collecte et 
I'analyse d'Informations pour surveiller que la mise au point ("tuning". SGA, ...) est loujours correcte. Uanalyse auto- 

•^5 nome peut etre egalement realisee en ramenanl les fichiers "paramlog" et "actionlog" de chaque noeud "N_agent" sur 
le noeud "N_admin". L'analyse autonome peut etre do plus r6alisee en recuperanl les fichiers d'analyse ("trace") des 
outils comme "DbaXpert" (Db* Activity, space monitor) ou autres. 

L'arret du surveillant sur le noeud "N_admin" arrele les sun/eillants sur les noeuds 'N_agenl". 

II peut etre ici rappele que la configuration de la surveillance est diffusee de maniere filtree a partir du noeud 

so d'administration vers chaque agent autonome de chaque noeud a surveiller au moment du lancement dudit agent 
autonome. sachanl que chaque noeud a sun/oitlor a ses propres fichiers de journalisation de parametres ("paramlog") 
et d'action ("actionlog") ainsi que ses propres processus de surveillance, tandis que le noeud d'administration, en lant 
que tel. possodo do plus les fichiers d'6tat des objcts survoillos ("obj_stato") ct d'affichago des parametres 
('•display_params"). Chaque agent est "reaclivablo" automatiquoment. coci signifie que lorsqu'un agent devient actif 

55 sur un noeud, i! commence par lancer la commande "mkitab" pour se meltre dans la table d'initiallsation "inittab" pour 
pouvoir etre reactive si le processus meurt ou si le noeud tombe en panne puis est reactiv6. Quand un agent est 
desactiv6. il lance la commande "rmitab" pour ne pas 6tre reactlver alors que le noeud d'administration ne le connalt 
plus. 
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Si un noeud k surveiller est declare indispontble ou hors d'usage. ses objets (instance oracle, application 
Tuxedo. . .) pui 6taient k surveiller et qui ont ete bascules sur un noeud de secours ("backup") doivent etre suivis par 
I'agent autonome sur le noeud de secours. Une nnaniere simple peut etre de nnodifier le fichier de configuration sur le 
noeud de secours en remplagant le nom du noeud indisponible par le nom du noeud de secours, ceci signifiant que 
toute la configuration est envoy6e aux agents sans supprimer les objets non surveill6s par un agent sur un noeud 
donn6. Pour cela, la connmande : 

NewObject old_node_objectjdent OBJECTS=:(object_ident. object Jdent ...). 

qui permet de faire connaitre k I'agent sur le noeud de secours les nouveaux objets ^ survoillor. objets qui 6taient 
surveiII6s par I'agent sur le noeud devenu indisponible. Dans "OBJECTS" ne sont sp6cifi6s que les objets (base Oracle, 
application Tuxedo. ...) qui ont 6t6 bascules sur le noeud de secours. 

De mani^re non linnitative, les principals caract6ristlques de quelques modules spdcifiques sont ci-apr6s preci- 
sdes. Ainsi, relativement au nnodule specifique k FSX. il doit etre. entre autres. pernnis : 

de specifier, pour le proc6d6 selon {'invention, des objets ^surveiller relatifs aux systemes de fichiers ("FILES YS- 
TEM") et relatifs k la pagination ("PAGING_SPACE"). 

d'appeler et int6grer I'interface GUI de configuration FSX depuis le menu "Configuration" du present proc6d6. 
d'autoriser des traitements tels que le contrdle p6riodique sur I'espace libre du disque et son extension, 
de modifier la periode du controle ou changer d'action si le controle est positif . 

de mesurer des parannetres tels que le coefficient d'occupation et la taille noaxinnale ("free_percent" et "max_size") 
en utilisant la condition pr6d6finie (si free_percent < config_min) et (max_size + incrsize <= config_max) alors 
action d'oxtension. 

a Tadministrateur de creer des conditions contenant [si (condition) et si (objl.free_percent < n)] alors ... 

De meme. relativement au module specifique k I'impression distribuee (DPF). il doit etre, entre autres, permis : 

de mesurer des param^tres de performances (nombre de pages par heure, par exemple). 

de demander une Impression, de gerer les demandes d'impression, de g6rer les queues, les dispositifs. 

de demarrer et arreter le trailement diff6re sur un noeud. 

de configurer les fichiers de traitement differe. 

de contrdler r6tat des fichiers de traitement differe, des queues locales, des dispositifs et des demandes d'impres- 
sion avec, si un problfeme est rencontre, la possibility de mise d'un message dans un fichier "log" explore par 
"RSF" qui alarme Tadmlnistrateur. Ces controles sont fails par un "demon" "dpf_status_chk" sur chaque noeud du 
domaine DPF. 

de controier I'etat des serveurs DPF et gen^rer automatiquement Taction qui corrige I'etat anormal. Un outil comme 
"Ib.admin" trouve les serveurs enregistres et le "d^mon" "dpf_server_chk" controle que ces serveurs repondent. 
S'ils ne repondent pas. ils sont automatiquement "tu6s" et I'enregistrement supprime alors qu'un message est mis 
dans le fichier "log" explore par "RSF" qui lance une alarme : alarme (fenfitre "affichage d'un message" ou dialogue 
pour savoirsi I'administraleur veutqu'une action propos6e soil ex6cul6e (ayec r6sullal visualise dans une fenelre), 
r6tat (et des informations d^taillees) etant remont6 vers interface GUI pour visualisation alors que de plus il est 
possible de changer la p6riode de certains tests (done documentes et identifies "paramjdent" par le module 
specifique), de supprimer un parametre "controle", et de dire si une analyse ('trace") est desiree ou non. Les 
"demons" sont lanc6s automatiquement par le systeme d'exploitation ("process init") et redemarr6s automatique- 
ment lors do rapparition d'uno panne. Lo nom du chomin "pathname" du lichior "log" explore par "RSF" ost con- 
figurable. 

d'appeler un outil d*administration dans le menu "Tools" comme DbaXpert, Tux_GUl, Onperf, ... 
de collector des m6triques. 
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Suit un exemple dQ miss en oeuvre du module sp6cifique a DPF : 

parametre DPF_SPOOLER_STATUS 
mesure : 

npstat-h <uname_node> 1> resultfile 2>npstat_errorfile 
si ($? != 0) 

SendMsg (E, npstat failed, npstat_eiTorfile) 
rc= $? 

sinon 

traitement resultfile => System <spooleP- <status> 

return current_param_value=status in (started, stopped, inconsistent, -) 

conditioni : 

si (GetDelta(cunrent_obj, DPF_SPOOLER_STATUS. &val) != 0) 
action 1 : 

si (current_param_value != "started") 

DisplayState (cun-ent_obj. DPF_SPOOLER_STATUS. DPF_SPOOLER. 
severe_color, cunrent_param_value) 

SendlVisg (A. <spooler> is <cunrent_param_value>) 

sinon 

DisplayState (current_obj, DPF_SPOOLER_STATUS. DPF_SPOOLER. 
ol^_color. current_param_value) 

SendMsg (W, <spooler> is <cun-ent_param_value>) 

parametre DPF_QUEUEJNSTATUS 
mesure : 

npstat -h <uname_node> 1> resultfile 2>npstat_errorfile 
si ($? != 0) 

SendiVisg (E, npstat failed, npstat_errorfile) 
rc= $? 

sinon 

traitement resultfile => Queue <queue_name> <instatus> <outstatus> 
<requests> 
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return current_param_value=instatus in (accepting, rejecting) 
condition 1 : 

si (GetDelta(current_obj, DPF_QUEUEJNSTATUS, Aval) != 0) 
action 1 : 

si (current_param_value != "accepting") 

DisplayState (cun^ent^obj. DPF_QUEUE_INSTATUS, DPF_QUEUE. 
waming_color, current_param_value) 

SendMsg (W, <queue_name> is <current_param_value>) 

sinon 

DisplayState (cun^ent^obj, DPF^QUEUEJNSTATUS, DPF_QUEUE. 
ok_color, current_param_value) 

SendMsg (W, <queue_name> is <current_parann_value>) 

parametre DPF_QUEUE_OUTSTATUS 
mesure : 

npstat -h <uname_node> 1> resultfile 2>npstat_enrorfile 
si($?!=0) 

SendMsg (E, npstat failed, npstat_errorfile) 
rc= $? 

sinon 

traitement resultfile => Queue <queue_name> <instatus> <outstatus> 
<requests> 

return current_param_value=outstatus in (started, stopped) 
condition 1 : 

si (GetDelta(current_obj, DPF_QUEUE_OUTSTATUS. &val) != 0) 
action 1 : 

si (current_param_value != "started") 

DisplayState (cun^ent^obj. DPF_QUEUE_OUTSTATUS, DPF_QUEUE. 
waming_coIor, current_param_value) 

SendMsg (W, <queue_name> is <cunrent_param_value>) 

sinon 

DisplayState (current_obj, DPF_QUEUE_OUTSTATUS, DPF^QUEUE. 
ok_color, current_param_value) 

SendMsg (W. <queue_name> is <current_parann_value>) 

parametre DPF_QUEUE_REQUEST_STATUS 
mesure : 
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npstat -h <uname_node> 1> resultfile 2>npstat_errorfile 
si ($? != 0) 

SendMsg (E, npstat failed, npstat_errorfile) 
rc= $? 

sinon 

traitement resultfile => Queue <queue_name> <instatus> <outstatus> 
<requests> 

si (requests > 0) 

res_npshow='npshow -S queue=<queue_name> 2> 
npshow_errorfile' 

si($?!=0) 

SendMsg (E, npshow failed. npshow__errorfile) 
return rc=$? 

sinon 

traitement res_npshow => nb_active 
si (nb_active = 0) 

return current_param_value=waiting 
sinon return current_param_value=ok 
sinon return current_param_value=ok 
conditioni : 

si (GetDelta(current_obj. DPF_QUEUE„REQUEST_STATUS. &val) != 0) 
action 1 : 

si (current_parann_value = %vaiting") 

DisplayState (cun-ent_obj. DPF_QUEUE_REQUEST„STATUS, 
DPF_QUEUE, warning_color, current_param_value) 

SendMsg (W, there are some requests waiting on <queue„name> 
queue, but none is active) 

paramelre DPF_DEVICE_STATUS 
mesure : 
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npstat-h <uname_node> 1> resultfile 2>npstat_enrorfile 
si ($? != 0) 

SendMsg (E, npstat failed. npstat_errorfilG) 
rc= $? 

sinon 

traitement resultfile => Device <device nanne> <status> 



return current_param_value=status in (idle_busy, disabled, paper_load, 
unbound, paper_empty. problem, suspended) 
condition 1 : 

si (GetDelta(current_obj, DPF_DEVICE_STATUS. &val) != 0) 
action 1 : 

si (cun-ent_parann_value != "idle_busy") 

si (current_param_value=("problenn" ou "suspended")) 

DisplayState (current_obj, DPF_DEVICE_STATUS, 

DPF_DEVICE, severe_color. current_param_value) 

SendMsg (A, <device_name> device is in abnornnal state 
<current_param_value>) 
sinon 

DisplayState (cunrent^obj, DPF_DEVICE_STATUS, 

DPF_DEVICE, ok_color, current_param_value) 

SendMsg (W, <device_name> device is <current_param_value>) 

sinon 

DisplayState (current_obj, DPF_DEVICE_STATUS. 

DPF_DEVICE, ok_color, current_param_value) 

SendMsg (W, <device_name> device is <current_parann_value>) 

Egalemenl, relativement au module specifique k Oracle, ii doit elre, entre autres, permis de controler I'acces aux 
objets pour pr6venir tout bloquage ou suspension ("abort") de ('application si cette dernidre d6sire acc6der ^ la base 
ou aux objels Oracle. Cerlaines infornnalions li6es a I'espace ("extents", "free list", ...) sont egalement conlr6I6es. De 
plus la collecte de nn6triques Oracle est aussi autoris^e. Les mesures ne sont effectu6es que globalennent et non sur 
un espace table ("tablespace") ou un processus particulier. Cela veut dire qu'il n'est pas possible de nnesurer par 
exemple le nonnbre de blocs alIou6s pour Tespace table "SYSTEM". Dependant, I'utilisateur peut cr6er un parametre 
et specifier la comnnande a ex6cuter, coname par exemple, 

CREATE_PARA!^ or716, ts_SYSTEM_bIocks. I^EASURE=(SPECIF„FILE,'x/y/2.sqr). [TRACE], PERIOD=12h. [CON- 
DmON=((# > 320) ACTION=(UNIX_FILE . W))]; 

Suit un exemple de mise en oeuvre du module specifique a Oracle : 
Relativement aux parametres et conditions predefinies : 
ORA_CONNECT : faire une connexion "<connect_string>". La valour du paramotre est 0 (OK) ou 2 ("connect" impos- 
sible). Si la connexion est impossible, Taction par d6faut est do relancer une fois la base. Choisir tes mesures les plus 
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utiles pour repondre aux objectifs du produtt : prdvention/detection de problemes d'espace ou de performances, aide 
a estimer revolution de la Base dans le temps. Choix des ou parmi les mesures suivantes ("source DbaXpert" et "server 
manager"). 

mesures sur I'activite du serveur: 

connected_user_count, session_count, waiting_sesslon_count, current_open_cursors, !ogical_reads, 
physicaljo, user_commits, recursive_calls. 

mesures sur les fichiers de donn6es d'entrees/sorties : 

dLphysicaLreads, df_physicaLwrites, dLphysical_bIock_reads, df_physicaLblock_writes. 
mesures sur la mise au point du cache ("cache_tuning") : 

logicaLreads, ddc.gets, free_buffer_requested, ddc„getmisses, free_buffersjnspected, physical_reads, 
ddc_get_hitratlo, buffer_cache_h it ratio. 

mesures sur les transactions : 

active_transaciions, rs_gets, rs.waits. redo_wrltes, redo_blocks_written. user_locks_count, user_rollbacks. 
mesures sur les 6lats : 

cumulaled_opened_cursor, parse_counl, long_lable_scans, shorl_table_scans, lable_felch„by_rowid, 
table_scan_rows_gotten, memory _sorts, disk_sorts, 

mesures sur les verrous ("latches") : 
latch_gets, latch_misses, latch_hitratio. 

mesures sur les processus : 
voir v$dispatcher, v$shared server, v$process. 

mesures sur les espaces table ("tablespaces") : voir "space monitor". 
ORA_ROW_CHAINING : 

Pour chaque table, mesure du nombre de lignes d'enchalnement ("row chaining") puis test par rapport a un seuil, 
par defaul, I'agent remonle une alarme vers I'historique du produit. DbaXpert/space monitor est appele et I'alarme TAO 
est configuree avec -s ORA_TA0.sh (script a appeler si alarme, qui envoie une alarme vers I'historique du produit) et 
3s -d 0 (pas de remontee d'alarme vers DB*Control). 

si une condition explicite n'exisle pas sur ce parametre : (aire "nnonitor table symptom=(TAO)", 

si une condition explicite avec "IGNORE" sur ce paramdtre : ne rien (aire, 

si une condition explicite exisle sur ce parametre, non combinee avec d*autres conditions : (aire 'monitor table 
symptom=(TAO. seuil [, hysteresis])", 

si une condition explicite existe sur ce param6tre; combinee avec d'aulres conditions : taire "monitor table symp- 
-^5 tom= (TAO, seuil [,hyst6resis])" 

acc6s aux objets : 

paramJdent=HEALTH. Acces aux bases (par SQL connect, la DB string user/passwd©dbstring dbc/dbc@T: 
so or714 est fournie par I'utilisateur). Si la coiinexion est KO : action ORA_CONN_FAIL et enregistrement dans 

le fichier "actionlog". 

teste que les bases do donnoos no sont pas d6marrees en oxclusif (par oubli du "DBA"). Le niveau d'alarme 
("info", "warning", "critical") est defini par I'utilisateur. Action "ORA.EXC.MOUNT". Enregistrement dans 
55 "irace_params''. 

si 'ARCHI VELOG", teste que le "process background arch" tourne sinon base de donnees bloqu6e des que 
les fichiers "redo logs" sont pleins. Action "ORA„ARCH_STOP" et enregistrement dans "trace_params". 
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ddtecte et corrige les archives de fichiers "log" satur^es. Correction par sauvegarde d'un nombre d'archives 
tel que un seuil d'espace libre est garanti dans le syst^me de fichiers. 

surveille les "processes background", verifie que ('instance oracle est stopp6e nornnalement ("normal shutdown") 
si stoppee. 

d6tecte si SQL*Net est tombe et assure la remise en route. 

d6tecte si une instance (ses "processes background" et autres) est tombee et assure la remise en route. 

space mgt : il taut prevenir les situations de blocage possible et ne pas s'occuper d'optimiser les performances, 
cecl est traite par "DbaExpert". 

Les blocages peuvent arriver si une table (ou un index, "cluster"", "rollback sgt") a atteint son extention maximale 
("MAXEXTENTS"), si la laille maximum d'un fragment est trpp petite pour allouer le prochain "extent", si les fichiers 
de base de donn6es ("dbfiles") sont pleins. Action dans ce cas. 

Par "tablespace". taux de remplissage des dbfiles > seuil x ? Si oui. action "ORA_FREE_TS". 

calcule la taille maximum des fragments. Si infdrieure ^ la valeur du prochain "extent" alors action 
•ORA_fVIAX_FRG'' el enregislrement dans le fichier "aclionlog". 

comparalson du nombre actual "d'extents" avec le maximum permis "MAXEXTENTS" (defini ^ la creation de 
I'objet, clause "STORAGE"). Dans ce cas, I'application utilisant la table sera suspendue ("abort"). II taut pre- 
venir cet incident. Action "ORA.MAX.EXT" si I'objet atteint son "maxextents". Enregistrement dans "action- 
log". 

etat des disques support des fichiers Oracle : une panne disque va se traduire par un return code Oracle (bloc 
corrompu) et seule I'application le recupere. Si detection, il faut au moins le signaler ^ I'administrateur 

- ...{ ORA_MAX_FREE_EXTENT_SIZE. object_ident tablespacename, 
value J, value_W, value_C 

! ORA_MAX_EXTENTS, objectjdent, usemame.objectname, {severj | 
sever_W | sever_C} 

! ORA_FULL_DBFILES. objectjdent, tablespacename. value_l. value_W, 
value_C 

} ' 



nombre de transactions oracle par seconde, pour un noeud donne. pour une instance donnee : Attichage. 

Parameire ora_tps, <object_ident>, 
command={SQL,'sqLtx'). FREQUENCY=30 
DISPLAY={*nombre de TPS ora_simuload'}; 
avec sql_tx : select gets/2 from v$latch where latchW=20. 

condition : si ce taux decrolt fortement et que le nombre d'uttlisateurs connectes ne decroit pas, alors declen- 
cher une action qui pourrait etre zoom plus detaille de parametres, enregistrement d'tnlormations. sauvegarde 
de fichiers "trace", collecte plus fine, ...) 

nombre moyen de serveurs partages oracle, pour un noeud donnd, pour une instance donnee. Pas d'affichage. 

Parametre ora_shared_srv, <object_ident>. 
command={SQL.'sqLsn/ SO'). FREQUENCY=30; 

avec sqLsrv : select count(*) from vSprocess where program like '%(S0%'; 
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nombre moyen d'utilisateurs oracle connect6s . pour un noeud donne, pour une instance donnee. Pas d'affichage. 

Paramelre ora_sessions, <object_ident>. 
command={SQL;sqLsessions'}. FREQUENCY=30: 

avec sqLsessions : select count(*) from vSsession where status='ACTI VE' AND lockwait is not NULL: 
distributeur ('dispatcher") ; 

Si un distributeur est tres occup6 ("delta(v$dispatcher.busy)/delta(t) > 50%") et que te taux d'occupalion cpu du 
nooud n'Gst pas trop grand {<80%), alors il faudrail ajoutor un distributeur de meme prolocole (action automatique ou 
recommandation). 

Si le temps d'attente/nombre de r^ponses ("v$queue.wall/v$queueJotalq") dans la queue de reponse du distribu- 
teur augmente regulierement et que le taux d'occupalion cpu du noeud n'est pas trop grand (<80%). alors il laudrait 
ajouler un distributeur de meme protocole (action automatique ou recommandation ). 

Quand oraSIDCurrentConnectedClients = oraSIDReservedConnections, aiors les demandes de connexion distri- 
buteur vont vers des serveurs dedi6s. 

Surveiller le nombre de connexions (moyenne, courante) sur chaque distributeur et sur chaque serveur partage. 

Si oraDispatcherRejeciedConnections augmente beaucoup, surveiller oraDispatcherState (BLOCKED. READY). 

Si oraPrespawnedSn/RejectedConnections augmente beaucoup. surveiller oraPrespawnedState (BLOCKED, 
READY). 

oraPrespawnedSrvProcessorlD est le process ID : fatre le lien avec la consommation ressources systeme. 
entrees/sorties : 

si mauvaise repartition des entrees/sorties sur les commandes ("drives"), au niveau systfeme : alors regarder 
la repartition des cntroos/sortics par instance ot sur los fichiors do base do donneos. 

Dg meme. relativomont au module specifique k Tuxedo, il doit elre, entre autres, permis de surveiller I'^tat 
des applications Tuxedo, des serveurs, des queues, du reseau en utilisant la commande "tmadmin psr, psc, pq, 
print_net". Pour Tuxedo, les serveurs administratifs ("BBL". "DBBL", "Bridge") et les applicatifs sont surveilles. 
L'acces aux differents noeuds de I'application Tuxedo (parlitionnement du reseau) ainsi que les queues utilisees 
par Tapplication sont verifies. Si I'application appelle des transactions d'une machine determinee. ladite machine 
deternninee est verifiee. 

Suit un exemple de mise en oeuvre du module specifique a Tuxedo :generation dans le fichier "objstate". via 
la fonction de base "DisplayState" : 

TUXEDO:<severilyJevel>:<appname>:NIL:<globaUci> 

TUX_MASTER:<severityJevel>:<node>:<appname>:<tuxJatherJd> 

[TUX_NODE:<severilyJevel>:<node>:<appname>:<tuxJatherJd>]... 

[TUX_QUEUE:<severityJevel>:<qname>:<appname>:<tux_fatherJd>l... 

[TUX_DOMAlN:<severityJevel>:<domain_name>:<appname>:<tux_fatherJd>] 



avec 

la ligne TUXEDO est gener6e en fonction de^s lignes tilles TUX_MASTER. 
TUX_NODE ... 

TUX_NODE : une ligne par Imid autre que master. 
TUX_QUEUE : une ligne par OSPACE (tbc). 
TUX_DOMAlN : une ligne par domaine. 

parametre TUX_xx_STATUS 

nombre do demandes do service (transactions) par secondo, pour un nooud donn6, pour une application Tuxedo 
donnee : cumuler le #RqDonG des serveurs autres que "BBL". "DBBL". "BRIDGE", "TMS*". Afflchage. 

Parametre SVC_<node>, <objec1Jdent>. 
command=iSHELL.'tmadmin_srv node'}, FREQUENCY=30 
DISPLAY={'nombre de TPS simuload*};; 
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avec lmadnnin_srv : tmadmin ...psr + filtre sur noeud + delta (#RqDone) par rapport ^ la derniere collecte, 
division par la frequence. 

nombre moyen de clients actifs, pour un noeud d6nn6, pour une application Tuxedo donn^e. Pas d'affichage. 

5 

Parametre CLT_<node>, <object_ident>, 
command={SHELL.'tnnadmin_dt node'). FREQUENCY=30; 

avec tmadmin_clt: tmadmin... pelt + filtre sur noeud + nombre de lignes client occupees (BUSY). 

70 - pour un serveur donn6 sur un noeud donn6 : le nombre moyen de requfites en queue, par queue. Lo fairo pour 
tous les serveurs. Pas d'affichage. Permet de savoir si le nombre de serveurs dupliqu6s est adapt6. Si la moyenne 
de requ§tes en queue est > 10 ( exemple 1 0 est un peu plus grand que le nombre moyen de clients actifs deman- 
deurs d'un service du serveur) alors action pour ajouter un serveur jusqu*^ max). 

75 Paramdtre SRVREQ_<srvname>_<node>. <objectJdent>, 

command={SHELL/tmadmin_srvreq node srvname*}. FREQUENCY=60 
CONDITION_S={&1 > 10}; 

avec tmadmin_srvreq : tmadmin ...pq + filtre sur srvname + chartip Queued. Cumuler le "Queued" sur les n 
sen/eurs sur le noeud, divlser par le nombre de queues. 

20 

avec Taction : 

SRVREQ_<srvname>_<node> : 

si cpu <node> < 80% then tmboot -s <srvname> -i num 
25 (num calculc avec tmadmin psr pour connailre les srvid actuels). 

pour un serveur donne sur un noeud donn6 : le nombre moyen de serveurs applicatifs sur un noeud donn6, pour 
une application Tuxedo donn6e. Pas d'affichage. A corr6ler avec la taille de la queue. 

30 Parametre SRVNB_<srvname>_<node>, <obiectJdent>, 

command={SHELL.'tmadmin_srvnb node srvname*}. FREQUENCY=60; 
avec tmadmin_srvnb:tnnadmin...psr + filtre sur srvname. 

pour un service donne sur un noeud donne, pour une application Tuxedo donnee : le nombre de requetes faites 
35 par quart d'heure. Le faire pour tous les services. Pas d'affichage. Pour mesurer I'utilisation des services. 

Parametre SVCDREQ_<svcname>_<node>, <object_ident>. 
MEASURE={UNIX_FILE .'tmadmin_svcdreq node svcname'), PERIOD=900 ; 

40 avec tmadmin_svcdreq : tmadmin ...psc + filtre sur svcname + delta (#Done) par rapport a la derniere collecte, division 
par la frequence. Cumuler !e #Done si le service est sur n serveurs sur le noeud. 

L'administrateur Tuxedo affecte un poids aux services et il s'en sert pour I'equilibrage de charge. Ces poids ne 
sont pas forcement bien choisis, surtout dans le temps. On peut pr6voirr que ces poids soient ajustes automatiquement 
en tonction de criteres administrateur 

Aussi, relativement au module specifique k "xcpa", il doit §tre, entre autres. permis d'utiliser la commando Vusr/ 
xcp2/up/dac_lu62 -a DSPSESST" pour connailre I'elal du groupe ("pool") "xcp2". 

Enfin, relativement au module sp6cifique "systfeme", il doit 6tre, entre autres, permis de contrfiler et mesurer le 
temps cpu. respace.disque. les enlr6es/sorties, la memoire, le d6bil l6l6com. le nombre d'ulilisaleurs, la pagination, 
le r^seau. etc.. II est ainsi par exemple possible de mesurer le taux d'occupation cpu par seconde, avec aflichage par 
50 defaut. ou le taux d'entr6es/sorties par seconde. ou encore d'identifier les processus les plus consommateurs de cpu 
et de les collecter pour realiser une analyse autonome ("offline", tbc). 

Pour conclure, suivant le present procede de surveillance, I'utilisation d'agents autonomes permet de s'assurer 
du bon fonctionnement des applications survoill^es sur rensomblo des noouds h I'aide d'un traitomcnt dccisionnol 
autonome et efficace appliqu6 au plus pres des objets ^ traiter, de faire remonter lorsque c'est necessaire et ceci tres 
55 rapidement, des noeuds 6 surveiller vers le noeud d'administration, les informations utiles et de tancer de maniere 
automatique des actions sur certaines conditions ou de conseiller Sventuellement une action. De cette maniere, une 
surveillance efficace des objets fonctionnant sur la plurality de noeuds est assur^e et une augmentation significative 
des performanvces est obtenue du fait de la capacity d'indSpendance offerte dans leur travail aux divers agents auto- 
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nomes. le procede ici appliqu^ pemnettant de mesurer des paramfetres sp^cifiques de cheque objet. de tester des 
conditions sur ces parametres relativennent a des seuils puis d'executer une action pour prevenir d'un problenne. pour 
reconfigurer ou corriger Des mesures sont collect^es pour realiser une analyse en temps differ^ dans le but d'un 
examen slatistique de Tactivite surveill6e. Ces mesures collectees concernent tous les types d'objets k surveiller, par 

s exemple ici des instances telles que des bases de donnees comme Oracle, Informix, les applications comme Tuxedo, 
differentes ou une quelconque machine, Timpression distribuee (DPF), etc.. Egalement, I'aspect synthetique d'un objet 
global defini de maniere generique. offre une tres grande liberie d'action et autorise I'exploilation efficace de la notion 
d'arboroscencG avec une grande precision relativement a revolution des grains de visualisation obtenus. Des corre- 
lations peuvent elre realisees entre plusieurs mesures diflerenles, en particulier, entre divers types d'objels, c'est-a- 

10 dire qu'une correlation intertype est ainsi avanlageusement proposee. Ce procede est en outre portable sur dill^rentes 
plate-formes, du fait de sa totale independance relativement a son environnement d'execution, la visualisation se 
faisant au moyen d'une interface graphique propre audit procede. Ce procede est de plus prevu pour auloriser tout 
inlerfa^age avec un quelconque systeme d'administration pour offrir a I'utilisateur une administration inlegree, les 
agents autonomes accedant aux differentes informations a travers les protocoles standards existants. 

Revendications 

1. Proc6d6 de surveiltence d'une plurality de types d'objets sur une plurality de noeuds comprenant un noeud d'ad- 
20 ministration dans un systeme informalique. caracterise en ce que. la surveillance est configuree puis diffusee de 

maniere filtree a partir du noeud d'administration vers des agents autonomes, un agent autonome etant instaile 
sur chaque noeud a surveiller pour, en off rant une correlation intertype, soit traiter au plus pres les diff6renls types 
d'objets ou ensemble d'objets d'un domaine appelo objet global defini de maniere generique. soit remonter des 
informations a visualiser vers I'inlerface graphique du noeud d'administration, chaque agent comportant une plu- 
2S ralitc do modules specif iqucs proprcs aux difforents types d'objets ou a un domaine particulier, chaque module 

specif ique mesurantdes parametres statiques et dynamiques, particuliers au type d'objet qu'il surveille et collectant 
lesdites mesures, testant des conditions sur lesdits parametres relativement a des seuils predefinis et declenchant 
eventuellement des actions associees auxdites conditions testees, les parametres, les conditions et les actions 
etant modifiables par Tutilisateur du noeud d'administration. 

30 

2. Procede de surveillance selon la revendication 1. pour Tapplication duquel le noeud d'administration comporte 
entre autres, une interface graphique utilisateur pour la visualisation des objets selectionnes et I'affichage de cour- 
bes de valeurs de parametres, un fichier de configuration qui contient I'ensemble des configurations des objets 
avec la description desdils objets de meme que I'ensemble des parametres predefinis statiques ou dynamiques, 

35 ce fichier etant analyse et dynamiquement modifie ou complete, des tichiers d'etat des noeuds c» surveiller ainsi 

que les fichiers d'affichage des parametres, les parametres mesures etant stockes dans un fichier d'analyse pour 
permeltre leur affichage par I'intermediaire de I'interface graphique. 

3. Procede de surveillance selon ta revendication 1 ou 2, pour Tapplication duquel I'agent autonome instaile sur 
^0 chaque noeud a surveiller se compose principalement d'un agent generique en relation avec une pluralite de 

modules sp6cifiques chacun propre ^ un type d'objet ou a un domaine particulier, de fichiers contenanl les fonctions 
de base utilisees, chaque noeud a surveiller possedant de plus ses propres fichiers de parametres, de conditions 
et d'actions associees pour contrdler sa propre surveillance et ainsi autoriser le trailement au plus pres des diffo- 
rents types d'objets en mesurant les parametres. en 6valuant les conditions et en lan^ant les actions liees aux 
45 conditions el ceci pour lous les objets decrils. 

4. Proc6d6 de surveillance selon les revendications 2 ou 3, pour I'application duquel. lorsqu'une condition non li^e 
a un paramelre porle sur un ou plusieurs parametres el done sur un ou plusieurs objets. ladile condition est Irailee 
sur le noeud d'administration par un agent generique qui traite les conditions sur plusieurs noeuds. cet agent 

so generique "d'administration" langant Taction sur le noeud d'administration. 

5. Procede de surveillance selon la revendication 4. pour lequel le Iraitement de I'agent generique •d'administration" 
sc fait do la maniere suivanlo: 

55 - lecture de son fichier de configuration, analyse syntaxique et semantique, 

fusion du fichier de configuration fourni par le noeud d'administration et du fichier de configuration foumi par 
les modules sp^cifiques. 
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envoi du fichier de configuration resultant ^ chaque agent en fillrant relativement aux objets a surveiller sur 
le noeud et en tenant compte des problemes inherents aux noeuds en panne ou aux noeuds prevus pour la 
sauvegarde des donn6es d'un noeud en panne sur un autre noeud. 

Proc6d6 de surveillance selon la revendication 5, pour lequel le traitennent de Tagent g6n6rique d'un noeud k 
surveiller se fait de la mani^re suivante : 

lecture de son fichier de configuration, seuls les objets locaux ^ ce noeud etant trait^s, 

construction de la table d'objets, 

construction de la table de configuration des paramdtres, 
construction de la table des valeurs de parametres : 

* chaque param6tre de chaque objet ayant au nnoins un emplacennent pour nnettre sa/ses valeur(s). le 
nombre d'ennplacements a reserver pour ce paramfetre de cat objet 6tant calculi, 

construction de la table des conditions multiples. 

fourniture des fonctions de base b I'usage des modules sp6ciflques pour certaines et pour les actions externes 
pour d'autres, 

lancement des modules specifiques : 

* certains modules spdcifiques poss6dant un traitement propre, alors que d'autres sont regroupes dans un 
seul traitement, 

* seuls les modules ayant un objet k surveiller 6tant Ianc6s. 

configuration d'un service de surveillance de fichiers de mani^re a permettre le traitement de I'exploration des 
fichiers de journalisation de tous les objets decrits, 

evaluation de chaque condition multiple, avec sa periode : 

* chercher les valeurs des parametres dans la table des valeurs de parametres ou via une fonction de base. 

* si la condition multiple est verifiee, lancer Taction interne ou externe.. 

surveillance reguli6re du bon fonclionnement des modules sp6cifiques, envoi d'un param6tre special et attente 
de la r6ponse. 

Proc6d§ de sun/eillance selon la revendication 6. pour lequel le traitement d'un module sp6cifique se fait de la 
mani6re suivante : 

exploration de la table de configuration des parametres en ne traltant que ses propres objets : 

* parametres d6j^ Irids par p6riode croissanle. 

* pour chaque paramfetre de chaque objet, seton la periode : 

faire la mesure en utilisant la commande interne (paramdtre prddefini) ou externe, la mettre dans la 
table des valours de param6trcs, 

si une analyse est effectuee. mettre la valeur dans le fichier d'analyse global cJe I'agent autonome, 
si un affichage est demand^, afficher la valeur ou I'^tat. 
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evaluer la condition simple, si elle existe. lancer Taction (interne ou externe) si la condition est vraie. 

traitement des demandes inopinees de mesure en temps reel de param^tre. 

Procede de surveillance selon la revendication 7. dans lequel, lorsqu*une action, prddefinie ou externe demande 
la valeur d*un parametre d'un objet surveille par un autre noeud que le noeud ou est execut^e Taction, la fonction 
de base qui demande la valeur transfere cette demande au noeud d'administration qui la dirige alors sur le noeud 
adequat alors que la valeur est relournee en sens inverse. 

Procede de surveillance selon la revendication 8, dans lequel, une des fonctions de base presentee est pr6vue 
pour ramener sur le noeud d'administration les fichiers de journalisation de parametres ainsi que ceux d'actions 
de chaque noeud surveille, pour {'analyse ind6pendante r6alis6e par le noeud d'administration. 

Procede de surveillance selon I'une des revendications precedenles, pour lequel le traitement d'un paramdtre est 
effeclue de la sorte : 

si le parametre est valide et la p6riode d^terminee alors la mesure est ex^cut^e, 

si une condition sur un parametre existe et que le parametre est valid^. alors la condition est 6valu6e 

Procede de surveillance selon I'une des revendications prec6dentes, pour lequel le traitement des actions est 
realise comme suit : 

I'agent generique et les modules specifiques demandent ^ lancer une action (predefinie ou fournie par I'ext^- 
ricur), 

toute action re9oit des arguments qui representent le contexte qui declenche Taction : 

dans le cas d'une condition multiple. I'identifiant d'objet, Tidentifiant du paramdtre, le num6ro de la condi- 
tion, 

dans le cas d'une condition simple, la valeur mesuree du parametre, son seuil et son hyst6r6sis, I'opera- 
teur. 
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